139 60 72MB
German Pages 312 [313] Year 2022
FESTKORPERPROBLEME XI ADVANCES IN SOLID STATE PHYSICS
in Referaten der Arbeitsgemeinschaften „Halbleiter" „Metallphysik", der Fachausschüsse „Tiefe Temperaturen" „Thermodynamik und Statistik", „Oberflächenphysik" der deutschen Physikalischen Gesellschaft unter Mitwirkung der Nederlandse Natuurkundige Vereniging Münster, 22. bis 26. März 1971
Herausgegeben von 0 . Madelung, Marburg
Mit 146 Abbildungen
Akademie-Verlag • Berlin 1971
Lizenzausgabe des Verlages Friedr. Vieweg + Sohn G m b H , Braunschweig Copyright © 1 9 7 1 by Friedr. Vieweg + S o h n G m b H , Verlag, Braunschweig Alle Rechte vorbehalten No part of this publication may be reproduced, stored in a retrieval system or transmitted, mechanical, photocopying, recording or otherwise, without prior permission of the Copyright holder Druck: E. Hunold, Braunschweig Printed in Germany First edition 1971 Library of Congress Catalog Card No. 6 4 - 5 1 8 9 1 Druckgenehmigungsnummer 100/594/71 Bestellnummer 7 6 1 551 2 (8044)
Vorwort
Wie in den letzten Jahren so trafen sich auch in diesem Jahre die im Arbeitskreis „Festkörperphysik" zusammengeschlossenen Fachausschüsse und Arbeitsgemeinschaften zu einer Frühjahrstagung. Gastgeber dieser Tagung, die vom 22. bis 26. März 1971 in Münster stattfand, war der Regionalverband Nordwestdeutschland der Deutschen Physikalischen Gesellschaft. Neben dem Fachausschuß „Halbleiterphysik", der jetzt zusammen mit den entsprechenden Fachgruppen der NTG und der GDCh die Arbeitsgemeinschaft „Halbleiter" bildet, der Arbeitsgemeinschaft „Metallphysik" und den Fachausschüssen „Tiefe Temperaturen" und „Thermodynamik und Statistik" nahm erstmals auch der Ausschuß „Oberflächenphysik'" der Deutschen Arbeitsgemeinschaft Vakuum teil. Der vorliegende Band enthält den größten Teil der auf der Tagung gehaltenen Hauptvorträge, darunter auch einige zusammenfassende Vorträge, die über die Probleme der Festkörperphysik hinausgehen. Der Titel der Buchreihe sollte hier keine Einschränkung sein. Da ich selbst an der Tagung nicht teilnehmen konnte, hatte mein Mitarbeiter Doz. Dr. U. Rößler einen erheblichen Teil der Arbeit des Herausgebers zu tragen. Ihm sei auch an dieser Stelle dafür herzlich gedankt. Die kurze Zeitspanne zwischen der Tagung und dem Erscheinen des Tagungsbandes ist nur möglich durch die reibungslose Zusammenarbeit mit dem Vieweg-Verlag, die mir stets eine besondere Freude ist.
Newark/Delaware, im April 1971
O. Madelung
Contents / Inhaltsverzeichnis
W. Spitzer Localized Vibrational Modes in Semiconductors Infrared Absorption
1
H. J. Queisser Deep impurities
45
W. Czaja Isoelectric Impurities in Semiconductors
65
M. Guntersdorf er Halbleiter-Metall-Übergang am Beispiel des V0 2
87
H. Bässler Liquid Crystals
99
H. Ibach Dynamische Eigenschaften an Festkörperoberflächen
135
W. Brenig Theorie elektronischer Eigenschaften amorpher Substanzen
175
M. Henzler Über den Ursprung der elektronischen Zustände an Halbleiteroberflächen
187
E. Menzel Einfluß der Präparation auf Versuche mit Kristalloberflächen
213
J. Langeheine Modellvorstellungen über Festkörperoberflächen und ihre experimentelle Bestätigung K. H. Gundlach Results of Elastic and Inelastic Electron Tunneling Through Potential Barriers in Solids D. ter Haar Plasma Physics and Astrophysics K. Elsässer Kinetische Beschreibung der ,Schwachen Turbulenz' B. U. Felderhoff Stochiastic Models in the Theory of Phase Transitions
Festkörperprobleme XI (1971)
Localized Vibrational Modes in Semiconductors: Infrared Absorption William G. Spitzer Departments of Materials Science and Physics, University of Southern California, Los Angeles, California Summary: A review is presented of the theoretical and experimental requirements for the observation of high frequency, localized vibrational modes of impurities in a crystal lattice. The discussion is restricted to the infrared absorption in semiconductor systems and as an example the experimental results for GaAs:Si are reviewed. The measurements supply information concerning four different point defects and their symmetries. Direct evidence for ionpairing and impurity site transfer is obtained. The technique is applied to study the role of other dopants on the Si site distribution and the site distribution of Si in GaAs grown from Ga solution. Other experimental results include recent observation of the Si local mode absorption in Ge rich GeSi alloys, measurements of impurity segration coefficients in several cases employing localized modes and observation of the phosphorus local mode for ion-implanted phosphorus in GaAs. Zusammenfassung: Die folgende Arbeit enthält einen Überblick über die theoretischen und experimentellen Voraussetzungen fur die Beobachtung hochfrequenter, lokalisierter Schwingungsmoden von Störstellen in einem Kristallgitter. Die Diskussion ist beschränkt und die Infrarot-Absorption in Halbleitersystemen, und für das Beispiel GaAs : Si wird ein Überblick über die experimentellen Ergebnisse gegeben. Die Messungen liefern Informationen Uber vier verschiedene Punktdefekte und ihre Symmetrien. Es ergibt sich ein direkter Nachweis für "ion-pairing" und "impurity site transfer". Das Verfahren wird angewendet, um den Einfluß anderer Fremdatome auf die Verteilung der Si-Atome auf die Gitterplätze zu studieren und um die Verteilung der Si-Atome in GaAs, das aus einer Ga-Lösung gewonnen wurde, zu untersuchen. Andere experimentelle Ergebnisse betreffen neuere Beobachtungen der Absorption durch die lokalisierte Schwingungsmode von Si in GeSi-Legierungen mit Ge-Überschuß, Messungen der Störstellen-Segregations-Koeffizienten in verschiedenen Fällen mit lokalen Moden und die Beobachtung der lokalen Mode des Phosphors für ionen-implantiertes Phosphor in GaAs.
1. Introduction In recent years there has been considerable interest in the lattice dynamics of crystals containing small concentrations of point defects. It is well known that presence of the defect modifies the normal modes of vibration of the perfect lattice. The effect on the normal modes of the lattice depends upon the nature of the defect. In many cases of interest the defects are substitutional impurities and, as will be seen, parameters such as the mass defect and effective force constant are used to characterize the changes in the eigenfrequencies caused by the presence of the defects. In some cases defects cause new modes to appear with frequencies larger than the maximum phonon frequency com of the unperturbed system. These modes are not traveling plane waves as are those of the perfect lattice but rather vibrational modes centered at the defect with the amplitude of vibration exponentially attenuating with distance from the impurity. Because of the spatial localization of the vibrational energy such modes are known as localized modes. If there is a forbidden fre1 Festkörperprobleme XI
1
quency gap between the phonon branches of the perfect lattice, then defects can also cause localized modes with frequencies lying within the gap. It is also possible for defects to cause a resonance-like behavior within the frequency spectrum of the unperturbed phonon branches. These modes are plane wave like in regions of the crystal removed from the defect but have a large amplitude at the defect. In the semiconductor systems to be discussed here (and in semiconductors in general) most defect mode measurements have been of the high frequency, localized vibrational modes. These modes are frequently infrared-active and are observed as bands in infrared absorption. In some cases they have also been observed in Raman scattering. Because the general calculation of the local mode frequencies involves a detailed knowledge of the phonon spectrum and eigenvectors of the perfect lattice, we will discuss some simple approximation methods for estimating coL values. In many cases the impurity introduced is an electrical dopant which results in free carrier absorption. The absorption cross section of the localized vibrational mode is usually much smaller than that of the free carriers in the frequency range of interest and electrical compensation is necessary to reduce the carrier concentration. For this reason sometimes more than one impurity is present and the defects considered are often complexes formed because of the tendency of some impurities to ion-pair. Thus the localized mode measurements can yield information of interest to the investigation of impurity interactions. Several of the points mentioned will be illustrated with a detailed review and discussion of GaAs:Si. The paper will conclude with some of our more recent work on selected systems and the application of the method to the measurement of ion-implanted impurities. Resonance modes, overtones, absorption by local + lattice modes, temperature dependence of the integrated absorption, line shapes and widths are all important topics which are not presented here but discussions are available in the literature ( 1 _ 4 ) . The emphasis of the present discussion will be not only on the experimental observations but also on the applications of the method to study other phenomena of interest to the solid state physicist.
2. Theory of Localized Vibrational Modes 2.1. Simple Model The theory of the effect of defects on the normal modes of a lattice have been discussed extensively by several authors with the contributions of A. A. Maradudin ( ' • 5 ) and of R. J. Elliott ( 2 > 6 - 9 ) with their co-workers being particularly well known. Some of the essential features can be introduced from simple reasoning and a simplified mathematical treatment gives some physical insight into the phenomenon. Consider an isotopic, substitutional impurity in a diamond-type lattice. The diamond-type lattice consists of two fee lattices with a relative translational displacement of 1/4 of the body diagonal. The system is monatomic and the nearest 2
neighbor configuration for any atom is tetrahedral with a center of inversion midway between any pair of nearest neighbors. The isotopic assumption is that the defect atom with mass M' replaces M, the host atom mass but with unchanged force constants. If M' < M, then as a first approximation we would expect a lattice. The frequency coL (^p*)1'2 > com makes M' produce a driving force acting on the lattice at a frequency above the high frequency cutoff for undoped samples. The amplitude of motion in such a case is exponentially attenuated as a function of distance from M'. The site of M' has tetrahedral symmetry and the potential for small displacements of the defect from equilibrium is that of a spherical harmonic scillator. Thus vibrations in the x, y and z directions are equivalent and we can expect the local mode to be triply degenerate. As the mass M' ^ M, we would expect the local mode frequency to decrease and the mode to be less localized. Some of these features can be deduced ( 10 ) from a consideration of the monatomic harmonic chain which contains a single mass defect. We assume that the normal modes of the chain of N particles with no defect are known and we call the mode frequencies co(q) where q is the wave vector. Writing the displacement p(x n ) of the particle at x n and the force F(x n ) on the x n particle as Fourier expansions gives i , x
P(x n ) = ^
^(q)eq
"
F X
ZF(2Mp(q) + T(q) p(q) = F(q),
(5)
where T(q) is the force constant for the q 'th mode. If F(q) = 0, then co2 = to 2 (q) = ^ ¡ ^ which are the solutions for the unperturbed chain. The response at the frequency w to F(q) is p(q) = ^
2
F
/f
a
•
(6) 3
Substitution of (4) into (6), multiplying by -772 e~ l q X n , and summing over all q values gives I V I V 1 F(x;) e i q ( x j" x n)
am Z *w
-® 2
- " 0 there is a single solution for co > co m and this is co L , the local mode. As M' decreases the value of coL increases as previously discussed. This result can be extended to a 3 dimensional cubic network of particles and one obtains
where s is the number of atoms/primitive cell, N is the number of cells in the crystal, and the factor of 3 arises from the dimensionality of the problem. The index j refers to the 3s phonon branches, i.e. 6 branches for the diamond and zincblende cases where s = 2.
4
2. Brief Review of Formal Theory The theory of Dawber and Elliott (hereafter DE) for the dynamics and infrared absorption of a lattice containing point defects ( 7 ) and the application ( 6 ) to the diamond-type structure is of particular interest here and will be briefly summarized. They assume an isotopic substitutional impurity with a static point charge e in an otherwise uncharged cubic lattice. Using a slightly modified form of the notation of DE, we have in the harmonic approximation the the equations of motion for the perfect lattice as:
2 2
C',K'
(3
where £ labels the cell, a the cartesian coordinates, K the sites within the cell, U the displacement from equilibrium (our p(x n ) in the previous section), and a K;j3 K ' (£, £') as the general interatomic force constants. When impurities are introduced equation (13) is modified to be
2 2
£',K' = A M K (£) U „
K
(3
(£) +
22 K'
0
K;
ft
K' ( 8 .
UP ( £ ' )
(14)
where the terms on the right are due to the mass change and changes in force constants. The similarity to the mass defect case of eqn. (9) is obvious. DE show 5
that the normal modes of the perturbed lattice are obtained from eqn. (14) with the solution being in terms of perfect-lattice Green's functions, and the eigenfrequencies of the perturbed lattice are given by det 1 2 g a ) K ; f t K ' ( 8 . « " ) C f t K " ; 7 ) K ' ( 8 " C ' ) - 5 a 7 6 K , K ' S ( C , C ' ) | = 0 , ftC"
(15)
where c
t t
, K; ft K' («,
«')
=
AM CO2 8ap8
KK,
5 (£, £') + A4»a> K ;
ft K ,
(£, 8')
(16)
and the g ^ K ; (3) K> is the Green's function relating the response for the coordinates of the ¡2th cell to an excitation of the 0 coordinates in the K'th cell at a frequency co. This result is not simple to evaluate in the general case where the Green's function is given by 1 8
c;;aK(q)ofK'(q)e^-(5g-^)
V
***K"N(MKMK01/a
h
" i ^ - "
2
'
where a j a K ( q ) is the eigenvector for the q'th mode in the j'th branch. For a cubic lattice with no changes in force constant, equation (15) reduces to
N
z r i co? (q) - co q. j J
•'-,
(.s,
M K ~ M'K where e K is the mass defect for the impurity on site K = —— .
For a monatomic crystal with the same mass at all K sites save the one with the defect, I a " K ( q ) l 2 = l/3s and we have 3s N èri co?(q) - co q.J i which is identical to equation (12). For the localized modes, where co2 = COL > maximum value of co? (q) we can replace the sum by an integral involving the density modes per unit range of co?(q) which gives ^ . r - e s a t e M - o . o where
Mm H = co?(q) and
6
J
(20)
G ( j x ) d n =
1.
DE applied these results ( 6 ) to the calculation of the absorption due to the local mode for an isotopic substitional impurity in a cubic lattice and the linear absorption coefficient a(co) is given by ¡X(0)l2g(co),
(21)
where D is the impurity density, e is the static charge on the impurity, n is the refractive index, and g(o>) is a line shape function where J g(oj) dco = 1. The o I x(0) I2 is the correction factor to account for the fact that the neighbors of the impurity may contain part of the kinetic energy of the mode. The I x(0) P is given by -l Mm
«w-ÊM S - ] • 0
If e 1 then M' I x(0) P -»• 1 which corresponds to the impurity vibrating against an increasingly fixed lattice and the mode frequency is determined almost completely by the impurity mass M'. Examples of coL and M' I x(0) P dependencies on e are shown in Fig. 2 as calculated by DE for silicon with a GQJ) given by Johnson. Recent theoretical work by Leigh and Szigeti ( 12 ) indicates that one should not place a great deal of reliance in the calculated absorption coefficient as the effective charge determining the absorption in valency crystals may be determined largely by short range effects. The static charge carried by the impurity may play a relatively minor role in the absorption.
Fie. 2. Dawber and Elliotts' calculations ( 6 ) of M-M' vs. e = ——— for Silicon.
— 1 (curve I) and M' Ix(0) I2 (curve II)
M
7
Fig. 3 r r ^ - 1 vs. e for indentical nearest neighbor impurities in Si with no changes in force constant as calculated by Elliott and Pfeuty (8).
Elliott and Pfeuty ( 8 ) have extended the DE local mode calculations to consider the modes of pairs of impurities. By limiting the region considered and invoking the symmetry of the defect, the Green's function calculations are considerably simplified. Among other configurations they have considered the case of two substitional impurities on nearest neighbor sites in the silicon lattice. Fig. 3 shows the isotopically calculated local mode frequencies as a function of the mass defect for two identical impurities. These curves are also useful for materials such as Ge, GaAs and InSb. The frequency density of states are very similar to Si in each of wm these cases if one simply adjusts the frequency scale according to co = W(si) • ——— Therefore Fig. 3 applies to all of these cases if the appropriate com and e values are used. In this approximation we have neglected the difference in mass between M G a and M A S ( 6 9 . 7 a n d 7 4 . 9 ) a n d b e t w e e n M ^ and M S B ( 1 1 4 . 8 a n d 1 2 1 . 8 ) .
2.3. Approximation Methods for Calculating coL In the following appproximations ( 1 3 ) we will consider the isotopic mass substitution in the diamond and zincblende lattices. The eigenvalue equation (12) for the diamond lattice can be approximated by using Einstein frequencies for each of the branches giving
ecoj
0 = 1+
6N
2N
TO2-col
N
N
L02-co2
LA 2 -co;
2N TA - co?
(22)
when coL is well above the top of the unperturbed phonon spectrum, i.e. coL > con The TO, LO, LA and TA are the Einstein frequencies representing the phonon branches and the factor of 2 takes the fact that there are two transverse branches 8
into account. Estimates of the TO, etc. frequencies are obtained from the multiphonon lattice absorption studies ( 14 ) and they are closely related to the peaks in the frequency density-of-states caused by each of the branches. This approximation should also be reasonable for III-V compounds where M m M v , i.e., A1P, GaAs and InSb. Cases such as GaSb where M m and M v differs by a factor of 1.8 require modification of eqn. (22). Marshall and Mitra have shown that for zincblende crystals LO/LA « (M(A)/M(B)) 1/2 , where M(A) > M(B) with A and B labeling the two sublattices. This relation indicates that the LO and LA have a heavy weighting of modes involving primarily motions of only one sublattice. Assuming the impurity is one which substitutes on only one of the two sublattices, we can empirically N N 2N modify eqn. (22) by replacing — — +T— by — — if the impurity 1 a LO -co, LO2 - o>l LA2 -co; substitutes only on the heavy sublattice A or by
2N if the substitution is on LA2 - co2
the B sublattice. Fig. 4 shows the dependence of coL upon e obtained for several different crystals by using the above approximation and Table 1 compares the calculated coL for several defects with the experimental values. A second and somewhat more elaborate approximation ( 1S ) method has been proposed by Lucovsky et al. in which they extend the linear diatomic chain model of Mazur, Montroll and Potts ( 16 ) to three dimensions and replace branches by Einstein frequencies. The comparisons with a large number of semiconductor and
200
400
600 0JL (cm )
800
Fig. 4 Plot of eqn. (22) for e vs. u L .
9
insulator systems indicate that the results are in generally good agreement with experiment. Hayes et al. ( 17 ) have also introduced a method for obtaining coL values which appears to be of a similar accuracy and perhaps more satisfying physically than the extensions of the chain model. A third approximation ( 18 ) method is very useful as it supplies not only the eigenfrequency of the local mode but also the eigenvector. The method has been used in the study ( 18 ) of GeSi alloys. We have a hermitian N X N matrix [M] and a set of eigenvectors Vj such that the eigenvalue equation [M] Vj = c^Vj
(23)
is satisfied and the vj form a complete orthonormal set. Then any N component trial function i// = £ C, v, and we set v t as the eigenvector corresponding to the i largest eigenvalue oj 2 =
If M so it will not produce additional co L values. Unfortunately it is usually very difficult to obtain better than order of magnitude compensation by this method for any significant volume of the ingot. Compensation can be completed by either of the two remaining methods. The second method involves the use of particle irradiation ( 2 3 _ 2 S ) . It is well known that in some cases, the carrier removal rates are sufficiently large and the limiting position of the Fermi level is far enough from the band edges that irratiation can be used as an effective method of compensation. Si and GaAs both become high resistivity with prolonged irradiation. Caution must be used however, as the defects produced can have a significant interaction with the impurities already present and thus have an influence on the vibrational absorption. The third method involves the introduction of a compensating impurity by diffusion under conditions where the solubility of the diffusant is controlled by the impurity to be compensated. It is well known ( 2 6 ) from the work of Riess et al. that the solubility of a donor (acceptor) in the presence o f a large acceptor (donor) concentration can be calculated by using dilute solution theory where the impurities, free electrons, and holes are chemical species. For example, the mass action relations show that an ionized donor with a solubility [Do] will have its solubility enhanced in the presence of a fixed acceptor concentration [A"] to be 1/2 -
[A"]
[A ]
[ D >
1/2
1/2
1 +
V [DQ] /
J
1 +
* [Do] fDnl /
where [Do] is the donor solubility when [A"] = 0, [nj] is the intrinsic carrier concentration [n,] 2 = [nf,] [n^], [A"] is the fixed acceptor concentration in the material, and [D + ] is the donor solubility in the presence o f [A - ].
12
+ [Do]
At low [A~], [DJ] = [D+], Under conditions where [DQ]> 2 [n{] and [A"] > [DO], then we enhance [D+] to [D+] = [A-]. This enhancement can be several orders of magnitude such as for Li donors in B-doped Si. The room temperature equilibrium solubility ( 26 ) of Li in pure Si is ~ 1015 cm - 3 . By heating to diffusion temperatures T D ~ 1000 °C and quenching rapidly to room temperature, non-equilibrium concentrations of electrically active Li (as measured by [n e ]) as large as 1017 to 1018 cm 3 can be produced at room temperature. However samples of B-doped Si with [n h ] ~ 1020 cm"3 are readily compensated by Li diffusion. The compensation is sufficiently close that no detectable free carrier absorption can be measured 1 cm" 1 ) indicating [n e ] and [n h ] 1S 3 10 cm" . The model for equation (30) does not take ion pairing into account. In all three methods there is the possibility that pairing will occur when the sample is held at temperatures where the defects or impurities are mobile. Therefore we can anticipate that when the diffusion method is employed, ion pairing should be prevelant. A number of experimental conditions must be met in order to successfully employ the diffusion technique. The diffusant must be capable of diffusion lengths ~ millimeters for temperatures and times where the original dopant does not out-diffuse or precipitate. The energy gap of the semiconductor and the solubility [Do] must be sufficiently large that
^ 1 at the diffusion temperature. This would
make Si and GaAs likely candidates while InSb and InAs would be unlikely ones.
4. Measurements and General Discussion A recent review by Maradudin ( ' ) gives an extensive summary of the various experimental methods which have been used in the study of the vibrational modes of lattices with defects. In the semiconductor systems, infrared absorption has been the primary technique used up to the present time. There have been only a few reports of Raman scattering and phonon-aided tunneling in semiconductor junctions. There is likely to be more effort at the Raman experiments over the next few years as they have some advantages. In most cases the free carrier absorption cross section increases with decreasing frequency. Since the Raman measurements are made at photon energies near the energy gap, the free carrier absorption is low and compensation is not necessary. With laser sources, lines with small frequency shifts are observable and thus gap modes and low frequency resonance modes can be observed. Depolarization measurements can provide direct information on the defect symmetry. There are also defects which can have Raman lines which are infrared-forbidden and thus Raman and infrared absorption measurements complement one another here as in molecular spectroscopy. The primary difficulty with the Raman measurements at the present time is the lack of sensitivity, however higher power sources and improved detection systems can be expected to largely eliminate this difficulty. 13
A summary of localized mode measurements in semiconductors is given in Table 2. Impurities such as A1 and P in GaAs and InSb, B in GaP, etc. are isoelectronic and do not contribute free carriers. Therefore these modes are observed without the necessity of using a compensating impurity. It may be noted however that with most other impurities, pair bands, i. e. those due to a defect consisting of two impurities on adjacent lattice or interstitial sites, account for most of the observations. Indeed in some cases it is the pairing impurity used for compensation which gives rise to the observed vibrational modes. For example consider GaAs:Te-6Li. In this case ( 2 8 ) Te-doped GaAs is n-type with the Te occupying As sites as Te As donors. Since the mass of Te is 127.6 and that of As is 74.9, no high frequency local mode of Te As is expected. However, when GaAs: Te is diffused with 6Li at a temperature T D ~ 700 °C, the sample is electrically compensated. The diffusion is done from a surface alloy is removed and the surfaces polished for transmission measurements. The Li must be an acceptor and the defect proposed is Li Ga . When the infrared absorption measurements are made, two bands are observed at 419 and 510 cm"1. When 7Li is used as the compensating impurity the blands shift to 391 and 475 cm -1 . These shifts are close to what one expects for a highly localized mode involving primarily Li motion, i.e. =
,
/M(7Li)\1/2
/ 7 V/» -39l(|) = 422 cm
compared with the value of 419 cm"1. However 6 Li Ga has T d symmetry and should therefore have only one absorption frequency (triply degenerate). If an impurity has T d symmetry, the potential ( 29 ) on terms of impurity displacements from equilibrium is V = Ar2 + Bxyz + Cj (x4 + v 4 + z 4 ) + C 2 (y 2 z 2 + x V + x 2 y 2 ). Neglecting terms higher order than quadratic gives the potential of a spherical harmonic oscillator and hence the frequency for the x, y and z directions are degenerate in agreement with our previous observations. The B, C! and C2 terms lead to overtone absorption but this will not be considered further here. The presence of two bands can be explained by the pairing of TeAs-Li 10 1 8 cm" 3 , any additional Si dopant goes almost equally on the two sub lattices. The ratio of the two concentrations for an amphoteric impurity such as Si was shown ( 3 2 ) to be (31) where i refers to the intrinsic state and E F is the Fermi energy. If ([Si A s ]/[Sic a ])i < 1, as seems to be the case, then as [Si] increases, E F will move from E F j towards E c , the bottom of the conduction band. Thus Si A s formation is enhanced. This model neglects the role of ion pairing which could result ( 3 3 > 3 4 ) in the enhanced probability of formation of (Sic a - Si A s ) nearest neighbor pairs or more complicated complexes. Before discussing local mode absorption measurements, it is of interest to inquire as to the anticipated nature of the results on the basis of the prior theoretical discussion in this paper and in the literature. The S i G a defect has T d symmetry, and therefore there should be one absorption band observed at low [Si]. The Si A s also has T(j symmetry and therefore should have one absorption frequency. The e ( S i G a ) < e ( S i A s ) which predicts c j l (Si A s ) > co L ( S i c a ) although the difference is small. However, S i ^ has four As nearest neighbors and Si A s has four Ga nearest neigbhor and we therefore can expect differences in the nearest neighbor force constants which may alter the above considerations. If we ignore these considerations and treat the Si as an isotopic substitutional impurity in a lattice o f atoms having a mass midway between that of Ga and As, effectively similar to Si G e in a Ge lattice but with the characteristic phonon frequencies of GaAs, then coL = 349 cm" 1 from the first approximation method and co L = 378 cm" 1 if one uses the DE calculations of Fig. 2 with ( 1 4 > 3 S ) co m (GaAs) = 295 cm" 1 (see Table 1). As will be mentioned in a later section, S i G e has been observed in Raman scattering and infrared absorption and co L = 390 cm" 1 . 15
Fig. 5. A model for an undistorted (Si(ja _L 'Ga) P a i r showing the approximate relative positions of the nearest neighbor impurities on the Ga sublattice in GaAs.
Since the GaAs: Si is n-type, it is necessary to compensate the material and Li and Cu have been used ( 3 6 ) as the diffusing species. In this case the Li (or Cu) must act as an acceptor or ion-pair with the excess Sic a to remove the shallow donor state. The acceptor species proposed is Li Ga which could be a single or double acceptor. The (Lio~ a -Lii) pair has also been proposed, where Li,*is an interstitial Li donor. In the simpler pairing case. (Si^a—Li 3 8 ) for several GaAs samples doped with different concentrations of Si are given. All but one of the samples were diffused with 6 Li or 7 Li at diffusion temperatures T D < 700 °C. In one pair of samples we have a comparison of 6 Li and 7 Li diffusion where the [Si] is nearly the same (see Table 3, samples 5 and 6). The most heavily Si-doped sample was diffused with Cu at 900 °C. Several of the samples were taken from pulled ingots where the melt was contained in an A1 2 0 3 crucible and the band ( 3 9 ) at coL = 362 cm"1 is due to Alc a (T d symmetry). 16
;; =» ;( m~ 4
Fig. 6 A simple model for (SiCa'^As) P 3 " defect in GaAs. The defect point group symmetry is C3 V .
CD, > CO, > 0U3 > 0J A
Fig. 7 A plot o f the measured absorption coefficient at liquid nitrogen temperature vs. frequency (wave number) for several Si doped GaAs samples. The [Si] increases with increasing sample number with samples 5 and 6 being approximately the same. The initial carrier concentrations and compensating diffusants are listed in Table 3.
2 Festkorperprobleme XI
17
The band near 389 c m - 1 in the 6 L i diffused samples is not observed in either the 7 Li- or Cu-diffused cases. This same band is also observed in undoped GaAs ( 3 7 > 3 8 ) which is diffused with 6 Li, and it is therefore unrelated to Si or Si-Li defects. Moreover, this band is much more sensitive to T D than any o f the other bands in the system. This same sensitivity is noted in the GaAs:Li studies and we have therefore attributed the 389 cm" 1 band to some Li-lattice defect complex. Neither the 362 nor the 389 cm" 1 bands will be considered further in the present discussion. The general features o f the spectra are readily interpreted in accord with our previous discussion. The band at 384 cm" 1 is the first one to be observed and is the dominant band in the spectra. This band is attributed to S i G a . The next band to be observed is at 399 cm" 1 and is the Si A s band. As anticipated the co L ( S i A s ) > W L ( S i G a ) although only about half of the difference in the GJl values can be accounted for by the difference in mass defects (with the DE calculated curve of Fig. 2). The remaining shift is presumably due to changes in force constants. Three high frequency bands are observed to show a large shift when 6 L i is changed to 7 Li. The bands shift from 4 7 0 , 4 8 0 and 487 cm" 1 to 4 3 8 , 4 4 8 and 455 cm" 1 . CJ ( 7 L i ) /6\1/2 = \ 7 / In the rigid lattice approximation — ^
these frequencies are close
to satisfying this relation indicating the modes are almost pure Li vibrations. The splitting is indeed small compared to the T e A s - L i Q a modes. It therefore seems reasonable to assign these modes to the Li vibrations of ( S i G a _ LkJa)pair defects. Three Si bands are expected from this same defect pair and are observed at 374, 379 and 405 cm" 1 . These bands are not expected to shift significantly for 6 L i - > 7 Li as they are primarily Si vibrations and no significant shift is observed. However, when Li is replaced by Cu, shifts can be expected as the perturbation of the potential at the Sioa site will change thus altering force constants. The bands change to 374 (slight shift but less than 1 cm" 1 ), 3 7 6 and 399 cm" 1 . The latter band is superimposed upon the S i A s band and results in an apparent increase in its strength. There remain three bands at 3 6 7 , 3 9 3 and 4 6 4 cm" 1 . These bands are at frequencies and have strengths which are independent of whether 6 Li, 7 Li, or Cu is diffused. The strengths o f these bands are always proportioned to one another as indicated in Fig. 8, and the strength o f the 393 cm" 1 is approximately proportional to products of the 3 8 4 cm" 1 and 399 cm" 1 bands strengths (the S i c a and S i A s bands). These bands appear to be three o f the four predicted for ( S i c a - S i A s ) . The 367 and 393 cm" 1 are close to the predicted 369 and 3 9 0 c m - 1 . The 4 6 4 cm" 1 is substantially larger than the calculated coi = 419 cm" 1 but this is the out-of-phase axial mode CO] and its frequency should be extremely sensitive to the S i G a - S i A s force constant which is not included in the calculation. The predicted co4 = 327 cm" 1 is in a range of large lattice absorption and has not been observed. The results are summarized in Table 4. All of the bands observed in the GaAs:Si can be explained on the basis o f previously proposed defect modes and there are no modes remaining which are not accounted
18
100010
10 -H
50
100
500
100-:
10--
10 «(o)
1.0
Fig. 8 A plot of the peak a values of the 393, 464 and 367 cm" 1 bands wehere a (464) is given by X and a (367) by o and the tie lines indicate measurements on the same sample. Thus a (464) ss a (367)
reported ( 5 0 ) value for k is 0.16. While the conditions of growth were not identical in the different studies, the difference in k values is difficult to explain. Local mode measurements for GaAs:P give k = 3.7 compared to 2 and 3 from previous studies ( 5 1 ) and for GaAs:Si we get k = 0.1 to 0.2 compared to 0.1 and 0.14 previously reported ( S2 ). An illustration of the difficulties which can occur from inadequate care in the measurements is illustrated in Fig. 23. In this case, an ingot of GaAs:Al was grown with C 0 = 9X 1018 cm - 3 according to the A1 added to the melt. The ingot was grown in a pure vitreous carbon boat sealed in quartz ampule. The resulting ingot was Si contaminated and the k H curve was determined from Hall measurements [n e ] = ([Si G a ] - [Si As ]). The point A on the k S i G a curve was corrected to B by adding the intergrated absorption of the Si As band which became appreciable in the last portion of the ingot. Clearly the curves do not fit the equation for a single k and more control over the crystal growth conditions is needed before a reliable value for GaAs:Al can be obtained. It is not surprising that values of k in the literature ( 5 3 ) range from 0.2 < k < 3 for this case. 6.3. Ion Implantation The use of localized mode absorption measurements to study ion implanted species in semiconductors is a very recent development. The localized modes of 0 implants in Si ( S4 ) and P, A1 and Si in GaAs ( 5S ) have been recently observed. At the time of this writing, the work is sufficiently preliminary on the A1 and Si implants that only P in GaAs can be discussed in any detail. 30
G a A S : Al [Al] = 9xlC © Optical data -Al 0 o 362cm" 1 Bond A Optical data - S i ^ a M c m 1 Band •
Hall data -
77°K
Fig. 23
.10
.22
.34
.47 .61 FRACTION SOLIDIFIED
(g)
.75 .77
— — — — ^ f a — — ^ s —
17.0 t
A plot of eqn. (33) for GaAs:Al which was Si contaminated during growth. The curve labeled kpj was obtained from n e measurements.
LOG (l-g)
Most studies reported in the literature ( 5 6 ) have been concerned with the electrical properties of the implanted layers and the behavior of the implanted species have been inferred from these studies. In a few cases back scattering and channeling techniques have been used to obtain quantitative information on disorder and lattice position of implants. However, in a III—V compound semiconductor, measurements have not yet been made to provide information on the site distribution of substitutional species. Therefore the identification of the impurity site and the symmetry of the potential are important contributions to the information concerning such systems and in some cases this information can be obtained from local mode measurements. GaAs single crystal wafers with chemically polished (110) surfaces were used for the implants. The implants were done under the supervision of A. Kahan at the United States Air Force Cambridge Research Laboratories with a Van de Graaff accelerator with an approximate flux of 3 X 10 12 ions/cm 2 sec. Gaseous PF 5 was ionized, accelerated to lMeV, mass analyzed for P 3 1 ions, collimated and allowed to strike the GaAs sample at room temperature. A GaAs sample implanted with a fluence of 2.8 X 10 16 P + /cm 2 at lMeVwas isochromally annealed for 1 hr. periods at 100 °C intervals between 200 °C and 900 °C. The resulting liquid nitrogen values of a p x p in the vicinity of the w = 355 cm - 1 band of P A s are shown in Fig. 24. The values of a P x P are obtained from the measured transmission by using T =
(l - R ) 2 e - a s * S e - a P * P 1 -R2e"2asxse-2aPxP 31
where a p is the phosphorus absorption in an implanted layer of thickness x p , asxs refers to the absorption in the substrate, and R is the reflectivity. Since a s x s A can be independently determined and R is assumed to the that of GaAs, the a ppx, p can be determined and / ( a p x p ) dco = L values. See for example, L. Genzel, K. F. Renk and R. Weber, Phys. Stat. Sol. 12,639 (1965) and N. Krishnamurthy and T. M. Haridasan, Phys. Letters 21,372 (1966). W. G. Spitzer, Semiconductors and Semimetals (R. K. Willardson and A. C. Beer eds., Academic Press, 1967) Vol. 3. G. Lucovsky, M. H. Brodsky and E. Burstein, Phys. Rev. B2, 3295 (1970). P. Mazur, E. W. Montroll and R. B. Pitts, J. Wash. Acad. Sci. 46, 2 (1956); also see ref. 5. W. Hayes, H. F. Macdonald and C. T. Sennett, J. Phys. C (Solid State Phys.) 2 , 2 4 0 2 (1969). A. Cosand, J. Appi. Phys. to be published. same as ref. ( ' p. 156.
(20)
P. Leung and W. G. Spitzer, unpublished data; H. Hara and Y. Nisbi, J. Phys. Soc. Japan 21, 1222 (1966). The data must be extrapolated to the frequency range of interest.
(21)
W. G. Spitzer and M. Waldner, J. Appi. Phys. 36, 2450 (1965).
22
( )
V. Tsvetov, W. Allred and W. G. Spitzer, Localized Excitations in Solids (R. F. Wallis, ed., Plenum Press, 1968) p. 185.
(23) (24)
J. F. Angress A. R. Goodwin, S. D. Smith, Proc. Roy. Soc. A287, 64 (1965). R. C. Newman and R. S. Smith, Localized Excitations in Solids (R. F. Wallis, ed. Plenum Press, 1968) p. 177.
(25) (26)
W. G. Spitzer, A. Kahan and L. Bouthillette, J. Appi. Phys. 40, 3389 (1969). H. Reiss and C. S. Fuller, J. Metals 8, 276 (1956): C. S. Fuller, Semiconductors (.N. B. Hannay ed., Reinhold, 1959) p. 192. W. Hayes, Phys. Rev. 138, A 1227 (1965). O. G. Lorimor and W. G. Spitzer, J. Appi. Phys. 38, 2713 (1967).
(27) (28) (29) (3°)
131) 132) f3)
34
R. C. Newman, Advances in Physics 18,545 (1969). This is an excellent review of the Infrared Absorption due to Localized Modes. J. M. Whelan, J. D. Struthers and J. A. Ditzenberger, Proc. of the International Conference on Semiconductor Physics (Publishing House of the Czechoslovakian Academy of Science, Prague, 1960) p. 943. The author's experience in the crystal growth laboratory at the University of Southern California. R. L. Longini and R. F. Green, Phys. Rev. 102,992 (1956). H. J. Queisser, J. Appi. Phys. 37, 2909 (1966).
(ST)
C. Kolm, S. A. Kulin and B. L. Averback, Phys. Rev. 108,965 (1957). F. A. Johnson, Progress in Semiconductors, Vol. 9 (Peigamon Press, Oxford 1965). H. Reiss, C. S. Fuller and F. J. Morin, Bell System Tech. Journal 35,535 (1956); C. S. Fuller and K. B. Wolfitim, Solid State Commun. 2, 277 (1964); C. S. Fuller and K. B. Wolfstim, J. Appl. Phys. 34,1914 (1963). O. G. Lorimor and W. G. Spitzer, J. Appl. Phys. 37, 3687 (1966). W. G. Spitzer and W. Allred, J. Appl. Phys. 39,4999 (1968). O. G. Lorimor, W. G. Spitzer and M. Waldner, J. Appl. Phys. 37, 2509 (1966); S. D. Smith, R. E. V. Chaddock and A. R. Goodwin, Proc. of the International Conference on Semiconductors (Phys. Soc. of Japan, Kyoto, 1966) p. 67. W. G. Spitzer and A. Allred, Appl. Phys. Letters 12,5 (1968). W. P. Allred, G. Cumming, J. Kung and W. G. Spitzer, 2nc* International Conference on GaAs, Dallas, Texas (Institute of Physics and Physical Society, 1968) p. 66. H. Rupprecht, J. M. Woodall, K. Konnerth and D. G. Pettit, Appl. Phys. Letters 9, 6 (1966). W. G. Spitzer and M. B. Panish, J. Appl. Phys. 40,4200 (1969). D. W. Feldman, M. Ashkin and J. H. Parker, Jr., Phys. Rev. Letters 17, 1209 (1966); J. H. Parker, D. W. Feldman and M. Rubenstein, Bulletin of the APS 14, 343 (1969). A. E. Cosand and W. G. Spitzer, J. Appl. Phys., to be published. R. C. Newman and J. B. Willis, J. Phys. Chem. Solids 26, 373 (1965); R. C. Newman and R. S. Smith, J. Phys. Chem. Solids 30, 1493 (1969). W. Kaiser, Phys. Rev. 105, 1751 (1957). W. G. Pfann, Trans. AIME 194, 747 (1952). For references see Fractional Solidification, (M. Zief and W. R. Wilcox eds.) Vol. 1, M. Dekker, New York 1967. /. B. Jullin, J. Electronics and Control 4, 358 (1968). R. K. Willardson and W. P. Allred, Proc. Intern. Symp. on GaAs in Reading (Institute of Physics and the Physical Society, 1966) p. 35. L. Skolink and W. G. Spitzer, J. Phys. and Chem. Solids, to be published; J. M. Whelan, J. D. Struthers and J. A. Ditzenburger, Properties of Elemental and Compound Semiconductors (Intersciences, New York 1960), p. 275. see reference ( S1 ); L. R. Weisberg, F. D. Rosi and P. G. Herkürt, Properties of Elemental and Compound Semiconductors (Intersciences, New York 1960) p. 25. H. J. Stein and W. Beezhold, Appl. Phys. Letters 17,442 (1970). L. Skoblik and W. G. Spitzer, Bulletin of the APS 15, 1614 (1970). J. W. Mayer, L. Eriksson and J. A. Davies, Ion Implantation in Semiconductors (Academic Press, New York 1970). See reference ( 39 ), first paper listed.
35
Table 1. Some calculated U>L values for substitutional impurities. The Density of States values were obtained from Fig. 2 as described in the text. The characteristic frequency values were determined from Fig. 4 Impurity
Host
"L Density of States cm-1
U L Characteristic Frequency cm-1
U L exp
cm-1
10
Si
682
662
644
n
Si
664
637
620
Si
644
618
608
Si
625
599
586
Si GaAs
610 374
584
572
354
362
GaAs
368
334
355
GasiAs Aim
GaAs
378
349
384, 399
InSb
-
298
296
Alca
GaSb
-
297
314
PSb 14 Np
GaSb
-
323
321
GaP
-
499
493
BSi BSi
12
cSi 13 csi 14 cSi
A1 p
Ga
As
si
14
Cp
GaP
-
499
564
A'Ga
GaP
-
480
443
Si G a
GaP
-
472
453
36
VA SO vi' •o" ï-H tf
„ „
OS Os r-- c->o »O -H
B o o -a •a S 2 £ -fi » e/j
m
r» ren
TT v> en
en * C en en
o
¡>
en
(M>
u
VI O
O 00 W t 00 en
o 00
V)
O t
O oo
Os t CT* *£> en en
"O X3 f1^ f-1 t " u
u
j
3
40
O 00
en (N I"
CT*
o 00
v¡
> M U
O 00
m CT*
CT. ren
n>
e
O 00
o o* en
t CT* o en t
u
Q.
Ô 00
W) V") O U->
O 00 IS)
rt
o.
O o 00 00
r00 f
O 00 6,7 ) Silicon, however, still presents a mystery; we do not know how and where an excess carrier recombines and what determines lifetime in this technologically most important material. ( 8 ) Impurities in a semiconductor can easily be treated when the foreign atom is of similar size as the host atoms and substitutes as a singly charged ion with the same coordination number as the host atoms. This substitution occurs for the common donors and acceptors and is well explained by "effective-mass theory". ( 9 ) We encounter a simple hydrogen problem in a medium with a large static dielectric constant e and a carrier of small effective mass m*. The larger is e and the smaller is 45
m*, then the better is the theoretical prediction of the energy levels. We obtain "shallow" levels close to the corresponding band edges and delocalized wave-functions with a Bohr radius for the ground state a 0 = h 2 e/m*e 2 which extends over many lattice spacings (e. g. 100 A in InP) (10) and is consistent with the original assumption of using a static dielectric constant to describe the lattice and a delocalized band function for the bound carrier. The energies are represented by a Rydberg formula
(2) The success of the effective-mass theory is well known, especially for donors in III—V semiconductors with their small electron masses. But even here the theory must be refined to consider the specific chemical identity of the dopant by means of central cell corrections. Recently, progress was made in understanding these chemical trends for acceptor binding energies in Si and Ge by considering electronegativity differences. ( n ' 1 2 ) A "deep" ( 13 ) electronic level is introduced by a foreign atom — or a complex of impurities plus native defects such as vacancies — which represent a major disturbance of the lattice. Obviously the effective-mass theory cannot apply, even if corrections are attempted. The binding energies become much larger than those predicted by effective-mass theory, the wave functions become localized — thus the initial assumptions for effective-mass theory fail. We therefore have no general formalism available at present to predict the electronic structure of deep imperfections. The experimental results are sparse compared to the shallow levels and largely heuristic. This talk does not attempt to cover the entire field, but wants to review the overall situation in a tutorial manner. At first we discuss some general qualitative features of deep levels and try to point out their significance for basic semiconductor properties. Secondly a brief review is given for current trends towards a better theoretical understanding and a first-principles calculation of level energies. The third part summarizes recent experimental results with an emphasis on optical techniques.
2. General Properties of Deep Impurities Chemical impurities or native defects — such as the common vacancy — can seriously disrupt the periodic charge arrangement of the host lattice and cause a severe disturbance of the periodicity of the atomic order close to the defect. The significance of a lattice rearrangement near an imperfection had long been recognized in the color-center approach for ionic crystals; ( 14 ) its essential contribution for binding energies in tetrahedrally coordinated semiconductors (is.i6.x7) has been pointed out, for example by Phillips ( 18 ) in his discussion of isoelectronic centers. The subsequent talk will cover this problem in detail. ( 19 ) 46
Local charge imbalance and lattice strains lead to sharply localized wave functions and a tight binding of electrons or holes at the defect. Ionization energies of the order of the gap energy can result. The localization in real space means that wave packets are needed which extend far into wave-vector space. The localization further implies an electron-phonon coupling quite different from the one of shallow levels; we expect an increased coupling for the deep levels and the possibility of preferred interactions with a local phonon mode. The large ionization energy of the ground states implies that a second ionization state may energetically still lie within the forbidden gap of the host crystal. We therefore expect donors and acceptors with multiple charges to be introduced by impurities with large electronic and steric misfits. Such multivalent centers have been called "flaws". (20,21,22) These basic properties of 1. 2. 3. 4. 5. 6.
large ionization energies, poor fit and distortion of the host lattice, localization in x-space, and consequently delocalization in k-space, strong phonon coupling, and charge multiplicity have some obvious immediate consequences.
The solubility ought to decrease with increasing misfit. This is indeed observed ( 23 ) and depicted in Fig. 1. We have here plotted the experimental value of the maximum solid solubility in silicon for various impurities against their ionization energies. The standard shallow donors are most easily soluble, next are the acceptors, being followed by the typical deep impurities of the noble metals and transition metals group. There seems to be some general trend, as underlined by the empirical E|"4-line drawn through the data. The low solubility of deep impurities presents a serious impediment for experiments trying to measure properties of these centers.
4p s
V
B -Sb Li Ga Al
Si
\
o \
\~E>
\ .. \
-Cu Au Zn
S
»
»
Mn Fe
1 10
-2
1 10
Fig. 1
A r
.
\
1 I
Ej
(eV)
Maximum solid solubility versus ionization energy for various impurities in silicon, after ( 2 3 ) using the data compiled by W. R. Runyan "Silicon Semiconductor Techniques", McGraw Hill, New York, 1959
47
Experiments with deep impurities are further hampered by the localization of the wave functions which means reduced optical and electrical cross sections. We will see later that this localization makes optical absorption measurements very difficult, to which the phonon coupling aggravates by shifting oscillator strength into phonon satellites. Small solubility compounded to large ionization energy means that deep centers do not significantly affect carrier concentration in contrast to the shallow dopants. This fact might explain the historical neglect of deep impurities by the research associated with the transistor development. Control of conductivity type and magnitude depends to first order only upon shallow centers, which are adequately described by theory. The mobility, however, may be influenced by the presence of deep impurities, but usually not near room temperature where the lattice phonons outweigh the diluted centers. Control of minority-carrier lifetime is, however, quite another matter. Technologically this task is today at best solved empirically. ( 8 ) The problem of recombination is not yet satisfactorily understood. ( 1_4 ) We know that simple band-to-band radiative recombination presents merely an almost negligible fraction of all electron-hole recombinative processes. (1-4,24-26) ¡ t th u s s e e m s t o b e t r u e ^ ^ t he efficiency of luminescent and laser devices ( 26 ) or of solar cells ( 27 ) as well as the processes in the base layer of a transistor or the switching speed of a fast diode are all controlled by non-radiative processes. The suspicion arises that deep centers may be largely responsible for non-radiative recombination. This suspicion concerning non-radiative transitions can be reinforced by some plausible arguments. A deep impurity mediates between valence and conduction bands, while a shallow center only captures or emits carriers of its corresponding band ( 28 ) or possibly binds an exciton hole/electron-pair (which has a finite chance to undergo at least a partial non-radiative decay). The ambivalent character of the deep center is manifested by its multiplicity of charge states, probably in conjunction with a distinct lattice distortion for each separate state. Therefore the deep centers can capture either type of carrier which seems a necessity to bring about the localization and overlap of wavefunctions prior to recombination. Ultimately the excess energy represented by the additional minority carrier must be converted to phonons, a suitable task for a center with strong electron-phonon coupling. Finally, the question of conservation of crystal momentum arises, especially for an indirect semiconductor, such as silicon. Again this postulate seems easier to fulfill at deeper than at shallower centers because of the wider spread in momentum space for the wave function of the deep center and its phonon coupling. (29-31) These qualitative arguments have shown us that a better understanding of the electronic nature of deep traps would not only be desirable from several points of view concerning very fundamental questions of solid state physics but also seems to be urgently needed by semiconductor technology to replace empirical guesses by scientific principles. We will now discuss some recent developments which represent successful steps in that direction. 48
3. Theory Effective mass theory is clearly inappropriate for deep levels, even if corrections are incorporated to consider explicitely the chemical nature of the impurity. It seems unrealistic to start with delocalized band functions for a problem of short range potential with resulting localized electronic states. Appropriate localized functions seem to be a logical choice. Wannier functions come to mind first, since they are often used in the formal constructions of solid state theory. ( 31 ) Their use for deep-level theory has been advocated and outlined by Callaway and Hughes. ( 32 ) Wannier functions are, however, somewhat unwieldy to handle for practical numerical computations, but Callaway and Hughes could show means to overcome these difficulties. They represented the silicon vacancy by a pseudopotential and found indeed a localized state for this defect. Contrary to the situation of the shallow levels, one here finds that low-lying bands and interband couplings are important - supporting the intuitive arguments we discussed before. The neutral vacancy has also been treated by Tawil ( 33 ), who again represented this defect by a missing atomic pseudopotential and computed all matrix elements and other physical quantities. The formation- and migration energies for this important defect are of particular relevance for radiation-defect studies, in this context it was studied by Teichler and Seeger. ( 34 ) They also used a set of Wannier functions which are appropriate to the symmetry of the diamond structure. ( 3S ) These approaches with Wannier functions in semiconductors seem to present an improvement over previous treatments such as that of Bennemann ( 36 ) who used free-electron wave functions in zero order with his t-matrix method. The lattice distortion around a vacancy or a badly fitting impurity seems to play such a vital role that it cannot be neglected in energy level calculations. The JahnTeller effect, recently reviewed at this conference ( 39 ), was shown to be significant for several aspects of impurities in semiconductors.^7) These considerations of the importance of the local distorted lattice configuration create serious doubts if the pure undistorted crystal represents a good starting point at all; some sort of self-consistent treatment of the impurity or defect plus a few neighboring displaced host atoms seems to be required — similar in spirit as a calculation of atomic positions in and near the core of a dislocation. Watkins and Messmer (37>38) have recently described this type of treatment for two examples: the nitrogen donor and the boron acceptor in diamond. They used a technique which had been successfully applied to molecules. It is called "extended Huckel theory" and uses a linear combination of atomic orbitals to calculate the orbitals of the molecule (LCAO-MO technique). The deep defect is simulated by a cluster consisting of 35 atoms, as shown in Fig. 2. The center atom of the cluster can then be replaced by the impurity and its orbital functions. The molecular orbitals are given by
(3) V
4 Festkorperprobleme X I
49
Fig. 2 Cluster of 35 carbon atoms used by G. D. Watkins and R. P. Messmer, ( 3 7 > 3 8 ) for their LCAO-MO calculations of deep impurity levels in diamond.
where the \v a r e the atomic orbitals, which were taken by Watkins and Messmer to be one 2s- and three 2p Slater orbitals for each atom. The MO-energies Ej and the MO coefficients C^ are the solutions of (4) where are overlap matrix elements and HMV are the matrix elements of an effective one-electron Hamiltonian, which Watkins and Messmer approximate while using empirical atomic ionization energies. The major computational tasks are thus to calculate SM„, then to solve Eq. (3). The results of Watkins' and Messmer's calculations are most encouraging. The cluster of 35 carbon atoms is sufficiently large to show the characteristic grouping of the electronic states into bands and a forbidden gap, as indicated by part (a) of Fig. 3. The numerical agreement with conventional band structure calculations for diamond is good. Part (b) of Fig. 3 shows what happens when nitrogen is substituted for the center atom: a new state appears below the conduction band edge. The Jahn-Teller distortion ( 39 ) is taken into account in Part (c), which brings the total energy to a minimum and depresses the level of the substitutional nitrogen donor considerably, bringing it 2 eV below the conduction band in good agreement with experimental data. The distortion amplitude — also indicated in Fig. 3 as taken from Watkins and Messmer (37,38) ; s 26 % of the nearest neighbor distance, which clearly shows the importance of lattice distortion for the electronic energies of deep levels. These molecular-orbital calculations of Watkins and Messmer, exemplified thus far with the light elements C, N, and B, represent a major success towards an under50
Fig. 3 Results of the calculations of Watkins and Messmer for the one-electron MO calculations (37,38) Part a) shows the levels of the 35 carbon atoms of Fig. 2. Part b) gives these energies after the central atom of the cluster is replaced by a nitrogen impurity. Part c) shows the energies after consideration of the Jahn-Teller distortion. The inset shows the total energy versus normalized distortion, yielding a minimum for a distortion of about 26 % of the nearest-neighbor distance. (Figs. 2 and 3 reproduced with the kind permission of G. D. Watkins)
standing of deep centers. Several important points are in favor of this approach: the elastic forces are included, although implicitly, to consider the lattice relaxations around the defect; the wavefunctions are obtained directly for experimental checks; the cluster-approach represents a very good compromise between the idea of a strongly localized level and the idea of representing a host lattice which is essentially undisturbed a few lattice parameters away from the impurity. Further work has been announced as to be published soon, including treatments of vacancies and interstitials in diamond. These calculations will undoubtedly stimulate further theoretical and experimental efforts.
4. Experiments This talk cannot cover the vast amount of experimental techniques and data. We restrict our discussion to a few examples. The rather powerful technique of electron-paramagnetic resonance and the wide field of radiation-damage must be omitted here; reviews can be found in other volumes of this series and elsewhere. (40-43) 51
4.1. Electrical Measurements Electrical measurements have traditionally been very important for the characterization of deep levels. The Hall effect and photoconductivity experiments are the most common sources for level energies. Stored charge residing on deep traps can be detected by capacitance measurements utilizing Schottky barriers or junctions. (44,45) Noise analysis can also be useful for a determination of deep levels and their energetic position within the gap. i 46 ) All of these techniques involving electrical measurements essentially rely on an analysis of thermal activation energies and do not yield much detailed information on the microscopic properties, such as wavefunctions or potential, of the deep defect. It already takes a very sophisticated approach with some additional chemical information, for example, to draw conclusions from Hall effect data about specific configurations of defects, such as - for example — Cu-pairs in GaAs ( 47 ) or close donor-acceptor dipoles in GaAs. ( 48 ) Hopes to establish a new type of spectroscopy for impurity levels by means of tunneling of electrons across depletion layers or metal-oxide-semiconductor structures have not yet fully materialized. (4»-s2) Minority carrier lifetimes can be measured with a variety of methods, most of which present experimental difficulties and some ambiguities due to the spread in the definition of the term "lifetime". (53,54) These measurements can be reduced to one significant number for the impurity, its recombination cross section. No a-priori theory can as yet predict this number for a given defect to complete satisfaction. Recombination of hot carriers at Coulomb-repulsive centers has been studied in Ge, gut many adjustable parameters enter, and the distribution function of the hot carriers presents a major unknown and a difficult problem. ( s s ) All of these circumstances contributed to the unsatisfactory present situation that recombination processes and lifetimes are at best merely described by some purely empirical recombination cross sections. Some deep-level impurities or complexes can be introduced in such large concentrations that they pin the Fermi level in the center portion of the gap. Semi-insulating GaAs, with oxygen or chromium doping, is a well-known example. (56) ; the subsequent talk will be concerned with one specific aspect. ( 19 ) We do not want to go into these details here concerning the large field of luminescence, but some shortcomings of this method ought to be pointed out: (1) very little can in general be learned about excited states of the impurity, since most transitions from a band terminate at the ground state and (2) no quantitative information about the impurity - such as its optical cross section or even its concentration - can be deduced from the intensity of a luminescence line because the magnitude of luminescent radiation is in most cases limited by the unknown non-radiative recombination process. These two shortcomings are in general, however, more than compensated by the sharp spectral lines yielding well defined energy assignments and the extreme sensitivity of a luminescence spectrum relative to small amounts of impurities. 4.2.2. Absorption Absorption measurements have not nearly received as much attention in the study of impurities as did luminescence. Local phonon modes have served to identify some impurities in infrared absorption spectra. ( 58 ) Measurements of absorption caused by electronic transitions are not simply revealing the inverse processes of the radiative recombinations. The schematic of Fig. 4 illustrates the situation. In contrast to the sharp emission line we observe a broad absorption continuum with its flat maximum located at roughly 2 Ej. An absorption measurement therefore does not Fig. 4 Emission
Î Eg-iEj'fiww) eg-Ei
A.
ES photon energy
Absorption
Bg photon energy
Schematic comparison of optical measurements on a semiconductor with electronic transitions involving deep impurities. Upper part: photoluminescence emission spectrum, showing (1) some recombination transitions near the energy E g = E c - Ey of the band gap, (2) a strong signal resulting from an electron recombining with a hole at the deep center, located at energy E, above the valence band and (3) its LOphonon replica. Lower part: absorption spectrum with (1) excited hole states just
below Ej, (2) the transitions of the hole into the valence band at photon energies exceeding Ej with (3) LO-phonon generation, finally (4) exciton and band-to-band absorption near E g . Such situations are, for example, encountered in GaAs doped with Cu. Luminescence data, see ( 7 2 ) , absorption data in ( 6 4 ) .
53
yield as well-defined energies nor such an easily observable impurity-sensitive effect as does luminescence; the spectra are structureless and governed by transitions into a broad band-continuum, and the total optical cross sections are small. On the other hand, we can get information about the individual center — its absolute cross section — if we know their concentrations, or vice versa. Furthermore, we can hope to obtain information about excited states lying below the ionization continuum. Therefore absorption data — despite all their associated experimental problems — represent an ideal counterpart to luminescence experiments. Let us next consider an actual example: the deep Au donor in Si. ( 23 ) Fig. 5 shows an absorption curve as determined by the photovoltaic effect of a p—n junction in Si, additionally doped with Au. The junction here serves as a built-in detector for the absorbed near-infrared photons. The broad band at energies below the gap (E g ss 1.1 eV) is caused by the deep donor Au. At its ionization energy of Ej = 0.73 meV the absorption sets in and continues to rise because of more possible transitions into the conduction band continuum as photon energy increases. ( 76 ) We here see an important consequence of the spread in k-space which is typical for a deep center, as schematically indicated by Fig. 6. Conservation of total wavevector k for the transition and the negligible k of the photon call for vertical transitions, for which the minimal threshold energy is Ej. More transitions are possible at k 0, indicated by just one arrow, requiring increased energy because of the parabolic energy increase with k for the conduction band. The density of states in the conduction band p c continually increases with electron energy E according to /2m*\3/2 pc(E)dE = 4 7 r ( - ^ - e j V E ^ d E
(5)
while the density of tiie impurity decays with increasing k, for example according to a Gaussian e _ k 2 ' k o (which we tried to indicate in Fig. 6 by the width of the line
Fig. 5 Absorption of the gold donor in silicon, as measured by the impurity photovoltaic effect, ( 2 3 ) normalized for constant p h o t o n flux. The inner ordinate gives the optical cross section per gold atom. The dashed curve is t h e theoretical prediction for a delta-function binding potential. The peak near 1.1 eV is caused by band-toband absorption. I.I
54
hw(eV)
A energy
E
Fig. 6 Optical transitions from a deep donor into the conduction band continuum, schematically. The line widths in this drawing are varied in order to attempt an indication of densities of states and k-space spreading of the deep center, which result in the absorption maximum near hu> = 2 Ej. wave
vector
k
at Ej). The maximal product of the two densities lies close 2 E i ; thus for an assumed k-independent optical matrix element we expect a broad absorption curve with onset at E; and maximum near 2 Ej, as observed in many experiments. A quantitative explanation of optical transitions involving deep centers has been made by Lucovsky. ( S 9 ) He used a delta-function binding potential which has proven successful in explaining the gamma-dissociation of the deuteron. He obtains for the optical cross section o the following expression
(6) where Ej is the ionization energy, fico the photon energy, m* the effective mass, n the index of refraction. The expression (F e f f /F 0 ) 2 is an "effective field"-parameter ( 60 ), which takes account of the ratio between actual local electric field at the impurity relative to the average macroscopic field of the photon, it is an adjustable parameter but has been found to vary very little. ( 60 ) Equation (6) thus describes a function starting at E i; achieving a maximum at hco = 2 E,, then falling off like (ho>)"3/2. The fit (dashed curve) of Fig. 5 was calculated with Eq. (6) and shows how well the assumption of a delta-function binding potential seems to describe the deep Au donor in Si. (62> 78 ) Infrared absorption measurements at deep levels in GaAs have been initiated by the group at Texas Instruments ( 6 1 ) and were later carried on by Bldtte and coworkers at Frankfurt. ( 64 > 65 ) The experiments demand skill to detect the broad absorption spectrum of dilute, lowly-soluble impurities of individual small total absorption cross section. One therefore has to detect a very weak absorption signal, sometimes in competition with intrinsic phonon absorption. 55
Fig. 7
100
200
300 hu
•
64> 6 s ) Structure is seen, especially below the onset of the ionization continuum at llOmeV. These sharp lines are caused by transitions from the ground state to excited states. Phonon replica are observed at energies higher by 36 meV, which corresponds to the longitudinal optical phonon at the zone center. The hump near 115 meV may involve TA phonons, the one near 145 meV both LO and TA. Finally, there is evidence for onset of ionization into a second continuum, namely the spin/orbitsplitt-off valence band. Fig. 8 displays the first definite observation of the absorption of Cu in GaAs ( 6 6 ), a rather common and important impurity in this material. Cu is located deeper in energy than Mn; the ionization starts at 146 meV — in agreement with older Hall effect results. ( 6 3 ) We notice a qualitatively somewhat different spectrum compared with Mn. The transitions to excited states are no longer easily observed. Cu thus corresponds much better to the idea of a delta-function binding potential ( S9 ), where no excited states are predicted, and only the alternative bound versus ionized prevails. (A shallow hydrogen-like donor, on the other extreme, shows the typical series spectra of sharp lines and the comparatively suppressed continuum typical f o r a long-range Coulomb potential.) The wavy structure of the continuum is caused by the LO-phonon satellites. Gold and silver are yet deeper acceptors in GaAs; they have been measured recently in absorption ( 66 ), luminescence ( 67 ), and by Hall effect. ( 6 8 ) There is good agreement with the delta-function model. Fig. 9 shows a common plot for four acceptors and the Lucovsky theory. The quantitative fit is really quite good, because the parameter ( F e f f / F 0 ) 2 = 2.6 holds for all cases and is of reasonable value. No other parameter is needed, but — of course — the ionization energy Ej is used to normalize optical cross section and photon energy in Fig. 9. Compromises between the two extremes of Coulomb potential versus delta-function have been sought. Bebb and Chapman (69) used a formalism which had been worked out for atomic spectra: the quantum-defect method. This method assumes an asymp56
fiu
»
Fig. 8. Infrared absorption of the Cu acceptor in GaAs, which lies deeper than the Mn-acceptor shown in Fig. 7. Excited states are no longer observed, the bumps in the continuum correspond to ionization with simultaneous LO-phonon generation. Data by Blatte, see ( 6 4 ) .
hw
Fig. 9. Combined plot of the infrared absorption for various acceptors in GaAs, normalized with the ionization energy Ej. The dashed curve is Lucovsky's theory with a deltafunction potential binding the hole at the acceptor.
57
totic Coulomb potential sufficiently far from the binding center. A continuous joining is made to the complicated potential near the center, and this portion essentially determines the ionization energy, which is taken from experiment. The solutions of y 2
-fr-Ei]
c?)
must be found for F„, where p is an effective principal quantum number, given by Ej = -R*iT 2
(8)
R*, the effective-mass Rydberg constant, is thus modified by v. Often one writes v = n - n and calls ju the "quantum defect". The new quantum number v assumes values between 1 (Coulomb case) and zero (strong binding, delta-function-like). By appropriate choice of this parameter v one hopes to cover the particularly difficult transition cases, such as Mn in GaAs. Fig. 10 illustrates the situation. The mathematical problems are, however, not insignificant. Furthermore, one needs additional parameters, such as an effective radius of the unknown potential. Attempts to fit the absorption curves to the experimental data of Blatte and Willmann have as yet not been fully satisfactory, when compared to the good fit to the naive deltafunction model. This situation is somewhat disappointing, because rather than use just a delta-function one would like to draw as much specific information about the potential from optical data as possible, in order to ultimately relate this information to other data, such as recombination cross sections or capture coefficients.
a)
b)
c)
Fig. 10. Comparison of (a) Coulomb-potential, (c) delta-function potential and (b) the compromise of the potential of the quantum defect method. Upper portion shows potentials, lower portion gives product of wave-functions times radius showing the distribution for the bound particle. The horizontal lines in the upper figures indicate the ionization energies. (See H. B. Bebb ( 6 9 ) for details).
58
EQ'ELO
CO-Eta ^O
Fig. 11 Luminescence spectra for a variety of acceptors in GaAs. The spectra are shifted such that the zero phonon lines are all superimposed at photon energy E 0 . Depth of the acceptor center is increasing from Ge (42 meV), bottom spectrum, to Ag (220 meV), top spectrum. The increasing intensities of the satellites for LO and TA phonons are noticed as the ionization energy is increased. (Measurements for Ge see ( 7 0 ) , Mn ( 7 3 ) , Cu ( 7 2 ) ,
Sn( 7 i),Ag(").)
4.2.3. Phonon Coupling We have already discussed the expected increase of electron-phonon coupling with depth of the level and its significance for non-radiative transitions. Fig. 11 shows photoluminescence spectra of GaAs with various impurities, where we can see the increase of electron-phonon coupling. The spectra are superimposed in such a way that the energy E 0 always indicates the position of the zero-phonon recombination, where one electron from the conduction band recombines with a hole at the impurity. On the left, that is towards lower luminescence energies, of E 0 one can see the "satellites" which indicate associated generation of LO and TA phonons. The shallow acceptor Ge with its strong line at E 0 and merely one weak LO-satellite contrasts with the deep Ag, where the zero-phonon line is not even clearly seen relative to the strong satellites. A simple indicator for the strength of the coupling between the electronic transition and the phonons can be given by assuming with Hopfield ( 74 ) a Poisson-distribution for emitting n phonons with the electronic transitions: Nn Wn = e x p ( - N ) ~
(9)
where the average number N of coupling phonons gives an indication for the coupling strength. For longitudinal optical phonons (7S), Hopfield calculates ( 74 ) (10) 59
where a is the radius of the bound particle. The dielectric constants e0 and e„ apply to high and low frequencies, respectively. The deep centers of Fig. 11 in the essentially covalent semiconductor GaAs begin to approach the typical situation of the polar alkali halides with their extreme localization of defects and strong coupling to the charged ionic lattice. Here zero-phonon lines are regarded as notable exceptions. The broad spectra are termed "vibronic" because of the large average phonon participation in the electronic transition which are described quite effectively with a configuration coordinate model in which the lattice distortion plays a central role. ( 77 ) Fig. 12 gives more quantitative information on the phonon-coupling, based on luminescence and absorption data by Blatte ( 66 ) and Schairer ( 70 ). Plotted is actually the intensity ratio between zero-phonon and one-LO lines for various band-toacceptor recombination mechanisms. A linear dependence (slope n = 1 line of Fig. 12) may be expected from the simple theory by Hopfield ( 74 ), if center depth and coupling strength both are inversely proportional to particle radius a. The noble metals seems to obey a linear relation, as seen in Fig. 12. However, the transitions involving group IV-elements, including bound excitons at Sn and Si (see Fig. 12), seem to follow a quadratic law (n = 2), which is not yet adequately understood.
GaAs
Sn i/
ÏAu
/ /
•'
/
Mn
° Cu
/ / / /
/
/o/ Ge
Ex-Sn°,
© si
/ / /
/e
Ex-Si' 10
60
Fig. 12 Phonon coupling for band-to center and bound exciton transitions in GaAs, after W. Schairer (70).
50 100 energy
500 meV
5. Final Remarks This talk was meant to provide a broad review over fields of semiconductor physics where many unsolved problems remain despite great efforts, as documented by a huge amount of literature. Towards this original literature we must refer the readers who desire more specific information. The experiments covered by this review stressed optical techniques and concentrated upon the reasonably well understood III—V compound semiconductors. These crystals, especially GaP and GaAs, have been extensively investigated, they can be doped with fairly good reproducibility and yield emission spectra that are experimentally more easily detected than those of Si or Ge. Most experiments we described in detail here were done by my colleagues at the University of Frankfurt. I wish to take this opportunity to thank all of them for their collaboration and dedication. In particular I am grateful for aid and advice in the preparation of this talk to Drs. M. BJdtte and W. Schdrer as well as to G. Guttler, P. Hiesinger, N. Stath, and F. Willmann. The work at Frankfurt had been sponsored by the Deutsche Forschungsgemeinschaft within the „Sonderforschungsbereich Festkorperspektroskopie" and by the Fraunhofer Gesellschaft; this support is gratefully appreciated.
References (!)
P. T. Landsberg, phys. stat. sol. 41, 457 (1970); a recent general review about nonradiative transition mechanisms in semiconductors.
(2)
V. L. Bonch-Bruevich
(3)
P. T. Landsberg, Festkorperprobleme VI, O. Madelung, editor, Vieweg, Braunschweig 1967.
and E. G. Landsberg, phys. stat. sol. 29, 9 (1968).
(4)
W. Schultz, Festkorperprobleme V, Vieweg, Braunschweig 1966.
(5)
A survey of radiative and non-radiative mechanisms in III-V semiconductors, can - for example - be found in: P. J. Dean, Trans. Met. Soc. AIME 242, 384 (1968).
(6)
P. J. Dean, Invited paper, 35. Meeting of the German Physical Society, Hannover 1970.
(7)
The most recent detailed results of luminescence research can be found in the papers presented at the 1969 Luminescence Conference at Newark, Delaware (USA). Proceedings are published in J. Luminesc. 1, 2 (1970).
(8)
E. Spenke in "Semiconductor Silicon", R. R. Haberecht and t . L. Kern, editors, Electrochemical Society, New York 1969.
(9)
W. Kohn in "Solid State Physics" F. Seitz and D. Turnbull, editors, Academic Press, New York 1957, Vol. 5.
(10)
One experimental determination of the effective Bohr radius of a donor-electron in InP was made by U. Heim, Solid State Comm. 7, 445 (1969), in good agreement with effective-mass theory.
61
('') (12) (13) (14) (15) (16) ('7) (18) (19) (20)
J. C. Phillips, Phys. Rev. L e t t 24, 1114 (1970). J. C. Phillips, Phys. Rev. B l , 1540, 1545 (1970); B2, 4044 (1970). For one definition of "shallow" versus "deep" impurities, see M. A. Lampert, Proc. IRE 50, 1785 (1962). D. B. Fitchen, "Physics of Color Centers", Academic Press, New York, 1968. J. W. Allen, Proc. Phys. Soc. (London) J. Phys. C : l , 1136 (1968). G. D. Watkins in "Radiation Effects in Semiconductors", F. Vook, editor, Plenum Press, New York 1968, p. 67. For the Jahn-Teller effect in semiconductors, see T. N. Morgan, Phys. Rev. L e t t 24, 887 (1970) and Refs. 37-39. J. C. Phillips, Phys. Rev. Lett. 22, 285 (1969). W. Czaja, following talk at this conference; see this volume of „Festkörperprobleme".
(21)
The term "flaw" for a multivalent impurity was suggested by W. Shockley and J. T. Last, Phys. Rev. 107, 392 (1957). W. Shockley, Proc. IRE 46, 973 (1958).
(22)
J. S. Blakemore, "Semiconductor Statistics", Pergamon Press Oxford 1962.
23
( )
G. Güttier and H. J. Queisser, Energy Conversion 10, 51 (1970), also J. Appl. Phys. 40, 4994 (1969). The first paper gives a detailed discussion of deep impurities for solar cell efficiency; it is shown that previous proposals to increase efficiency by deep impurities are invalid.
(24) (25) (26)
W. van Roosbroeck and W. Shockley, Phys. Rev. 94, 1558 (1954). W. Michaelis and M. H. Pilkuhn, phys. stat sol. 36, 311 (1969). M. H. Pilkuhn, Proc. IX. Internat. Conf. Phys. Semicond. Moscow 1968, Publ. Nauka, Leningrad 1968, p. 523. W. Shockley and H. J. Queisser, J. Appl. Phys. 32, 510 (1961). For the extensive field of semiconductor statistics, see the textbook of Blakemore, Ref. 22.
(27) (28) (29)
On the question of the improbability of simultaneous phonon emissions during nonradiative transitions, see Refs. ( 1 _ 4 ) .
(30)
(32)
A very important proposed mechanism for nonradiative recombinations is the Auger effect, treated in detail by P. T. Landsberg and coworkers, reviewed in Refs. ( 1 _ 3 ). For an indroduction to Wannier functions, see for example C. Kittel, Quantum Theory of Solids, Wiley, New York 1963, esp. p. 195. J. Callaway and A. J. Hughes, Phys. Rev. 156, 860 (1967).
(33) (34)
R A. Tawil, Bull. Am. Phys. Soc. 15, 258 (1970). H. Teichler and A. Seeger, private communication.
(35)
A discussion on Wannier functions and their optimal adaptation to symmetry in the diamond structure is given by H. Teichler, phys. stat. sol. 43, 307 (1971). K. H. Bennemann, Phys. Rev. 130, 1757 (1963), Phys. Rev. 137, A 1497 (1965). R. P. Messmer and G. D. Watkins, Phys. Rev. Lett. 25, 656 (1970). G. D. Watkins and R. P. Messmer, Proc. X. Int. Conf. Semicond. Physics Cambridge, Mass. 1970; S. P. Keller et aL, editors, p. 623. W. Gebhardt, „Der Jahn-Teller Effekt", review paper in Festkörperprobleme IX, O. Madelung, editor, Vieweg, Braunschweig 1969, p. 99. D. Geist, „Paramagnetische Elektronenresonanz in Halbleitern", Festkörperprobleme II, F. Sauter, editor, Vieweg 1963.
(31)
(36) (37) (38) (39) (40)
62
)
A. Seeger, „Strahlenschädigung von Metallen und Halbleitern", Festkörperprobleme IV, F. Sauter, editor, Vieweg 1965. "Radiation Damage in Semiconductors", Dussod, Paris 1965.
4
)
R. Bäuerlein, „Strahlenschäden in Halbleitern und Halbleiterbauelementen", Festkörperprobleme VIII, O. Madelung, editor, Vieweg/Pergamon 1968. See, for example G. /. Roberts and C. R. Crowell, J. Appl. Phys. 41, 1767 (1970), describing "Capacitance Spectroscopy". Recently a technique was described by Y. Zohta, Appl. Phys. Lett. 17, 284 (1970), which utilizes characteristic differences between the standard capacitance method and the Copeland-technique for the analysis of deep impurities. J. A. Copeland, IEEE Trans. Electron Devices 18, 50 (1971). One example for the very complicated solid-state reactions in GaAs is described in: C. 5. Fuller and K. B Wolfstim, J. Appl. Phys. 34, 2287 (1963), and Appl. Phys. Lett. 2, 45 (1963). J. Rachmann, contributed paper at this meeting, demonstrating scattering of holes in GaAs by dipoles of impurities, Verhandl. Deutsche Physikalische Gesellschaft 9/1971, paper HI 10. R. C. Jaklevic, and J. Lambe, Phys. Rev. Lett. 17, 1139 (1966) detected organic molecules inside a tunneling barrier. Local phonon modes of impurities can be detected by tunneling, e. g. see E. L. Wolf, Phys. Rev. Lett. 20, 204 (1968). C. B. Duke et al., Proc. Tenth Int. Conf. Phys. Semicond., Cambridge, Mass., 1970, p. 856 report on impurity-assisted tunneling in GaAs junctions, also see TV. Holonyak, Jr. et aL, Phys. Rev. Lett. 24, 589 (1970). For more information on tunneling phenomena, C. B. Duke, Tunneling in Solids, Academic Press, New York 1969. W. Shockley
and W. T. Read, Jr., Phys. Rev. 87, 835 (1952).
For complete details on definitions and properties of the various lifetimes in a semiconductor, see Refs. 0 " 4 ) and ( 2 2 ) . R. G. Pratt and B. K. Ridley, Proc. Phys. Soc. 81, 996 (1963). References concerning the problems of semi-insulating GaAs are found in O. Madelung, Physics of Ill-V-Compounds, Wiley, New York 1964. C. H. Henry, K. Nassau, and J. W. Shiever, Phys. Rev. Lett. 24, 820 (1970). W. G. Spitzer, invited talk at this conference, see this volume. G. Lucovsky,
Solid State Comm. 3, 299 (1965).
D. L. Dexter, Solid State Physics, Vol. 6, F. Seitz and D. Turnbull, editors, Academic Press, New York 1958, p. 353. R. A. Chapman and W. G. Hutchinson, Phys. Rev. Lett. 18, 443 (1967). J. S. Blakemore and C. E. Sarver, Phys. Rev. 173, 767 (1968), also showed the success of the S-function model. C. S. Fuller, K. B. Wolfstirn and H. W. Allison, J. Appl. Phys. 38, 2873 (1967). M. Blatte, dissertation Frankfurt 1970; M. Kautzsch Frankfurt. Manuscripts in preparation.
and F. Willmann diploma theses,
The apparatus is described in: M. Blatte, Optics Comm. 1, 460 (1970). M. Blatte
and F. Willmann, to be pubL
(67) (68) (69) (70)
M. Bldtte, W. Schairer, and F. Willmann, Solid State Comm. 8, 1265 (1970). P. Hiesinger, Hall-data on Au-doped GaAs, to be publ. h. B. Bebb a n d « . A. Chapman, J. Phys. Chem. Sol. 28, 2087 (1967); H. B. Bebb, Phys. Rev. 185, 1116 (1969). w. Schairer, dissertation Frankfurt/M. 1970 (unpublished).
(71)
W. Schairer and E. Grobe, Solid State Comm. 8, 2017 (1970).
C2) (73)
H. J. Queisser and C. S. Fuller, J. Appl. Phys. 37, 4895 (1966). N. Stath, unpubL data in agreement with earlier data by T. C. Lee and W. W. Anderson, Solid State Comm. 2, 265 (1964). J. J. Hop field, J. Phys. Chem. Sol. 10, 110, (1959). A review concerning the effects of optical phonons in semiconductors is given by H. Y. Fan, Moscow Conference (see Ref. ( 2 6 ) ) p. 135. At this conference, H. G. Grimmeiss and co-workers presented a refined technique for measuring cross-sections with the photo-effect; new results for Si: Au were also reported, see: Verhandl. DPG 9/1971, p. 709, also to be publ. in Sol. State Electronics. For a very recent discussion of a vibronic center in GaAs and its configurational coordinates, see E. W. Williams and A. M. White, Solid State Comm. 9, 279 (1971).
(74) (75) (76)
(77) (78)
64
R. A. Messenger and J. S. Blakemore, recently discussed the effective-field correction for their data on Si:In, Solid State Comm. 9, 319 (1971).
Festkörperprobleme XI (1971)
Isoelectronic Impurities in Semiconductors Wolfgang Czaja Laboratories RCA, Ltd., Zurich, Switzerland
Table of Contents 1. 1.1. 1.2. 1.3. 1.4.
Introduction Isoelectronic impurities of first and second kind Some typical examples of isoelectronic impurities Optical spectra related to isoelectronic traps Electrical effects related to isoelectronic traps
2. 2.1. 2.2. 2.2.1. 2.2.2. 2.3. 2.4. 2.5.
The Hopfietd-Thomas model Acceptor-like and donor-like isoelectronic traps. The zero phonon lines The fine structure of the phonon-side bands ZnTe:0 as isoelectronic electron trap GaP:Bi as isoelectronic hole trap Pair spectra between Bi and donors in GaP Other examples of isoelectronic impurities The special case GaP:N
3. 3.1. 3.2. 3.3.
Theories of isoelectronic traps The work of Faulkner and Phillips The electronegativity picture Are there isoelectronic traps only an anion-sites?
4. 4.1. 4.2.
Concluding Remarks Practical application of isoelectronic traps Summary and outlook
Summary: This paper reviews what is known about isoelectronic impurities in semiconductors. There are two kinds of isoelectronic impurities, those which give rise to bound states (isoelectronic traps) and those which do not create localized states but form mixed crystal systems with the host. In this paper we are mainly concerned with isoelectronic traps. After reviewing optical emission and absorption spectra and some mobility data which exhibit the typical contributions due to the presence of isoelectronic traps in a semiconductor, the Hopfield-Thomas model is explained. According to this model isoelectronic traps can either attract an electron or a hole. The charged trap will subsequently bind a carrier of opposite charge by Coulomb interaction forming a bound exciton. The details of the model are compared with the known examples of isoelectronic traps. Zusammenfassung: Es wird ein Überblick darüber gegeben was isoelektronische Verunreinigungen sind und in wieweit man ihre Eigenschaften in Halbleitern versteht. Es gibt zwei Klassen von isoelektronischen Verunreinigungen, solche die zu lokalisierten Zuständen fuhren (isoelektronische Traps) und solche, die zu keinen lokalisierten Zuständen führen, sondern mit dem Wirtsgitter ein Mischkristallsystem bilden. Im folgenden beschäftigt man sich ausschließlich mit isoelektronischen Traps. Zunächst werden die fur diese Störstellen typischen 5 Festkörperprobleme XI
65
Emissions- und Absorptions-Spektren, sowie der Einfluß auf die Ladungsträgerbeweglichkeit diskutiert. Nach dem Hopfield-Thomas Modell ist zu erwarten, daß isoelektronische Traps entweder ein Elektron oder ein Loch einfangen können. Das damit geladene Trap bindet anschließend durch Coulomb Wechselwirkung einen Ladungsträger mit entgegengesetzter Ladung, d.h. es entsteht ein an das Trap gebundenes Exziton. Dieses Modell wird benützt um die Eigenschaften bekannter isoelektronischer Traps zu erklären.
1. Introduction In 1965 Aten and coworkers^ ) and Thomas and his colleagues ( 2 ) reported independently about a new kind of impurity states in semiconductors. These new impurity states which we are going to specify as isoelectronic traps give rise to highly localized states in the band gap. These isoelectronic traps are to be distinguished from shallow states as donors and acceptors, which by now are rather well understood and which are described by an effective mass approach ( 3 ). They also need to be distinguished from deep centres which have been known to exist for quite a while. But it appears that only recently( 4 ) some general trends and a simple but rather effective model have come to light indicating the possibility of an understanding of the properties of deep centers. In this contribution a survey of the properties of isoelectronic traps will be given and as far as possible a theoretical interpretation will be presented. However, as it will turn out, in this new category of impurities the understanding is lagging far behind as compared to the one for the above mentioned impurities. This is partially due to the fact that many careful measurements still have to be done, partially also that the theoretical problems to be solved appear to be rather complicated. 1.1. Isoelectronic impurities of first and second kind Isoelectronic impurities are defined as substitutional impurities which have the same valence electron structure as the atom they replace. Thus, isoelectronic impurities are neutral impurities; they do not lead to a doping of the semiconductor host crystal. However, one needs to keep in mind that the total number of electrons of the atom to be substituted and the substitutional isoelectronic impurity necessarily differ, sometimes by a rather large amount. As pointed out by Thomasi?) ( 5 ) there are two classes of isoelectronic impurities. • Isoelectronic impurities of the first kind which give rise to descrete levels (bound exciton state) in the forbidden gap, i.e. they generate localized states. • Isoelectronic impurities of the second kind which do not give rise to discrete levels; they produce band states instead. They will exist in a more or less wide range of solid solubility with the host crystal and generate a continuous shift of band gap energies as a function of the impurity concentration. 66
This simple distinction cannot be expected to hold generally and there are indications that systems may exist in which isoelectronic impurities change from first to second kind as a function of concentration^). Furthermore, it is conceivable that in some systems the distinction between first and second kind is not always straightforward (comp. GaP : Sb in( b )) so that the definition given should be regarded as representing particularly simple limiting cases. In addition, the experience up to now seems to indicate that isoelectronic impurities of the second kind are more abundant in nature than isoelectronic impurities of the first kind. 1.2. Some typical examples of isoelectronic impurities Some systems which fall under the category of isoelectronic impurities of the second kind are well known such as for instance, the Si-Ge-system ( 6 ), the GaAs x Pj _ x -system ( 7 ) and the Gai _ x In x As-system( 8 ). Their general behaviour is rather similar and well represented by the definition in the last section. Isoelectronic impurities of the first kind are listed in Table I. We will call these isoelectronic impurities "isoelectronic traps" since they produce localized states within the band gap. The data given in Table I are from the following sources: Bandgaps: CdS( 9 ), ZnTe( 1 0 ), GaP(' l ), AgBr( 12 ), AgCl( 5 ) Bound exciton energies (B.Exc.): CdS : Te( 13 ), ZnTe : 0( 14 ), GaP : N( 14 ), AgBr : I( s ), AgCl: I( 5 ). Free exciton binding energy (F. Exc.): CdS( ls ), ZnTe( 16 ), GaP( u ), AgBr( 12 ). Trap level: CdS : Te( 13 ), ZnTe : 0( 1 4 ), GaP : Bi( 14 ), GaP : N( 14 ). In the following we are exclusively concerned with isoelectronic traps. As can be seen from Table I neither the characteristic energy level (B. Exc.) nor the lattice structure, nor the fact whether the gap is direct or indirect is typical for isoelectronic traps. One therefore has to create a model for isoelectronic traps which explains their typical features independently of the above mentioned properties. In the two sections to follow, we briefly discuss the experimental observations by which the presence of isoelectronic traps manifests itself. 1.3. Optical spectra related to isoelectronic traps In Fig. 1 low temperature emission spectra of four of the isoelectronic impurities listed in Table I are shown. The data for ZnTe : 0 are from ref. 10, for GaP : Bi from ref. 17, AgBr : I ref. 5 and GaP : N ref. c and 18. In all these spectra very sharp emission lines are visible at the high energy end. At low temperatures the width of these lines is often considerably less than 1 meV. As shown in the case of ZnTe : 0 sharp lines occur in emission and absorption at the same energy, which means that they are due to an optical allowed transition without phonon cooperation. Therefore they are called zero phonon lines. At the low energy side of the sharp zero phonon lines, a broad emission band is observed which exhibits an appreciable amount of structure. 67
ENERGY (eV)
/2k
AgBrl
X
/ A
H h B A^IDWIDTH
2.20
68
230
2.40 220 ENERGY (eV)
2.60
r •0
i
1
1
A T
-
so •
1
B.
GaP:N
TO
-
A-X A-LOr
8 j? 60
-
-
z so
-
-
-
-
Z
s g" 3 11
30 -
20
A-TA*
I
-
B-LO^j 10 0^ N
A-TOr *
Saupe (')).
Typical pattern (textures) are existent for the nematic, the cholesteric and the smectic phase which allows their identification. Examples are shown in Fig. 9. Definite surface orientation can be achieved by specific surface preparation. Defined rubbing of the glass wall for instance, produces alignment of the long molecular axes parallel to both glass wall and rubbing direction. Careful cleaning of the glass with H 2 S 0 4 causes L i surface alignment. Other ways to achieve homogeneously aligned structures are to apply electric or magnetic fields or mechanical shear ( 6 1 > 6 2 ). Of special interest is the so-called "Grandjean-plane-texture" of cholesteric phases, characterized by h surface. Only this texture displays reflection colors and optical activity in transmission cells. The "focal-conic" texture ( 4 ) is a more disordered structure, with h on an average scale being parallel to the substrate. It is strongly birefringent, optically inactive, and displays reflection colors only if the backsubstrate is reflective ( 6 3 ) .
2. Fluctuations in Nematogenic Substances 2.1. Light scattering A non-uniform liquid crystal has a turbid appearance, because the macroscopic structural inhomogeneities scatter light. This effect is of practical importance, since macroscopic disorder can be produced in a definite way by external means, e.g. electric fields (see next chapter). It forms the basis for a number of electro-optic devices and can also be used for the determination of transition temperatures ( 6 4 ) and for studies on orientation correlations ( 6 S ). From the scientific viewpoint, however, it is more important to note that turbidity does not vanish completely if the sample is uniformly aligned: Liquid crystals show anomalous light scattering properties. Chatelain ( 6 6 ) was the first to conduct systematic studies on the light scattering properties of oriented nematic PAA. He measured the polarization and angular intensity distribution of scattered sodium light. He found (i) that the most intense scattered radiation is polarized at right angles to the plane of polarization of the incident beam, and (ii) that the intensity I of scattered light varies as I ~ (sin )~16 for 0 < < 50°, being the angle between incident and scattered ray. These results suggested the existence of scattering particles of typically 0.2 n in diameter. This in turn led to the conclusion that even an aligned liquid crystal is composed of "swarms" ( 4 ' 6 7 ) . The swarms were considered to be completely organized liquid monocrystals, the molecules in between having random orientation. Although there is little direct evidence against swarms, their existence is nevertheless very unlikely because of thermodynamic reasons: In view of the energetically favorable parallel alignment of the long molecular axes the existence of the high density of defects and dislocations implicitly postulated by the swarm-hypothesis seems to be 115
incompatible with the condition of minimum free energy. Moreover, all experimental results can be explained in a much more satisfactory manner adopting the continuum model, which assumes that in general n 0 is a continuously, slowly varying function of the spatial coordinates. Therefore the continuum model is now generally accepted. Extending ideas of DeGennes ( 6 8 ) the Orsay Liquid Crystal Group has recently developed a theory to describe the light-scattering properties of a nematic mesophase. It has meanwhile been confirmed experimentally by the same group ( 7 0 ) and by Hatter and Litster ( 71 ). The theory starts with the facts that a uniform nematic structure possesses a macroscopic optic axis represented by an average "director" n0 and, secondly, that the overall degree of alignment of the long molecular axes is determined by the ordering parameter S. On a microscopic level, however, there are thermally excited fluctuations, i.e. collective orientational motions of assemblies of molecules. The existence of such a cooperative effect is reasonable, since for instance S = 0.5 means, that the average angle 6 between L and n 0 is 35°. It seems plausible that a single molecule cannot deviate from its equilibrium position by such a large angle without affecting the position of its neighbors. This means that the local optic axis, defined by n (?) fluctuates: It has a transverse component 6 n (r). At any point ii0 = n (r) + 5 n (r). The effect can also be described in terms of local fluctuations of the ordering parameter. Since the local optic axis determines the local orientation of the tensor ellipsoid of the refractive index, spatial variation of if produces spatial variation of the refractive index. Fluctuations of n (?) can therefore act as scattering centers for light. The fluctuation amplitude 5 ii is time dependent and can be regarded as superposition of two uncoupled components 6 and 6 n 2 . The underlying normal modes 1 and 2 are the analogs to spin waves in a ferromagnet, which are local perturbations in the spin alignment. Each fluctuation mode can couple to an external radiation field. A Fourier component with wave vector q will cause a wave vector transfer k'=q + k
(6)
and a frequency transfer Aco = cj - to'. k and u> represent wave vector and frequency of the incident wave, k' and oj' are the analoguous quantities of the scattered wave. Analysis of the frequency shift of the scattered light as a function of scattering angle therefore yields information concerning fluctuation modes. The experimental setup is shown schematically in Fig. 10. Light of a HeNe laser is incident at right angle to the preferred axis of an aligned PAA sample. (In ref. ( 7 1 ) p-methoxybenzylidene p-n-butylanilin (MBBA) is used instead of PAA.). A photomultiplier detects the optical beats between the various spectral components of the scattered light as a function of the scattering angle. The resulting fluctuations of the photomultiplier current are Fourier-analysed by conventional spectral analyses in a frequency range 10 Hz to 500 kHz. Indices e and o indicate whether the polarization direction is extraordinary ( II n 0 ) or ordinary. Three configurations 116
—
|
| He Ne Laser
polarizer
Fig. 10 Schematic representation of light scattering experiments
(70,71) crystal
were studied: (ke,k e '), ( k e , k 0 ' ) and ( k 0 , k e ' ) . As a result of selection rules worked out by DeGennes ( 7 2 ) mode 1, which is a pure bending mode (see preceding chapter) is observed with the first configuration. In the other two cases interaction occurs with mode 2, which is a combination of twist and bend. An essential result of the experiment is that the spectral intensity distribution of the scattered light is centered around the incident energy and is purely Lorentzian in shape: l i ( W ) I2 ~ ( h ^ ' - h c o ) 2 + ( r / 2 ) 2 '
(7)
r denotes the line width. This proves the existence of the fluctuation modes and indicates that they are purely dissipative, i.e. strongly damped, their decay time being r = r _ 1 . Thus Rayleigh-scattering of light by a nematic liquid crystal is quasielastic and can be explained on a dynamical basis without invoking the existence of swarms. For a scattering angle 0 = 45° r/2ir is around 200 kHz. r depends on $ sincelqh 2nk sin (4>/2) and T is predicted to be of the form T = K q 2 /??, where n is the mean index of refraction, K is one of the Frank elastic moduli, depending on whether mode 1 or 2 is involved, and t? is one of the six Leslie viscosity coefficients ( 1 9 ). Knowledge of T and q therefore allows calculation of 17. Haller and Litster ( 7 1 ) have studied the temperature dependence of the scattering intensity which is predicted to vary as I ~ S 2 kT/K. In corroboration of the MaierSaupe theory they have found K/S2 to be temperature-independent. 2.2. Fluctuations in the Isotropic Phase The dependence of the light scattering intensity on the square of the ordering parameter suggests that in the isotropic phase analogous light scattering should be absent. This, however, is not the case. Litster and Stinson C 3 > 74 ) have observed quasielastic Rayleigh-scattering also from the isotropic phase of MBBA, its intensity decreasing proportional to (T - T*) -1 in a temperature range T c + 0.5 < T ^ T c + 15 °C. T c is the isotropic-nematic transition temperature. Numerically T c - T* = 1.0°. In the same temperature range the relaxation time r determined from the 117
width of the Lorentzian spectrum of the scattered light also varies proportional to (T - T c * ) _ 1 after correcting for the temperature dependence of a transport coefficient. In the range T c < T& T c + 0.5 the curve departs from linear behavior and diverges for T T c . These observations strongly suggest the existence of regions in the isotropic melt within which the molecular arrangement is ordered and, concomitanly, the existence of time-dependent, fluctuations in the degree of local order which is a function of the angle between the local optic axis and the long molecular axes. In the isotropic phase, however, the molecular mean field is no longer strong enough to superimpose long range order on the statistically oriented local optic axes. On a macroscopic level therefore no optic axis is established. Instead orientational correlation is confined to microscopic regions whose dimensions decrease as T — TJ increases. The Litster and Stinson results can be interpreted in terms of the Landau theory for second order phase transitions. A correlation length of the form
(8) can be introduced to measure the spatial extent over which fluctuations are correlated. A reasonable estimate for £0 is 15 A, the average linear dimension of a molecule. In simple mean-field theory the relaxation time of a fluctuation is proportional to | 2 . Therefore the observed T" 1 ~ (T - T c *) _ 1 dependence is readily explained. Obviously the isotropic-nematic phase transition displays typical features of a second order phase transition: There is a pronounced pretransitional ordering phenomena when approaching the transition temperature from the high temperature side. Shortly however, before the second order transition temperature TJ is reached, a weak first order transition intervenes which forces the system macroscopically into a state of finite order. Apparently the mean-field theory does not correctly describe the detailed behavior in the critical temperature region near T c since it does not include the effect of large fluctuations as the phase transition is approached. On the other hand the occurrance of a residual first order phase transition can account for the small latent heat — much of the orientational order is already being established above T c —, the small volume change C 2 ' 1 5 ), and the discontinuity in the ordering parameter observed at T c . The existence of short-range order above T c has independently been established in two types of experiments. (i)
118
Cabane and Clark ( 7 6 ) have investigated the temperature dependence of the line width A of the N 14 NMR spectrum in PAA which is inversely proportional to the transverse nuclear spin relaxation time. According to a theory by Pincus ( 7 7 ) spin relaxation is caused by highly damped hydrodynamic modes which are identical with orientation fluctuations. The experimental finding that A = 5.0 (T - T c *)"' 12 Gauss ° K " " 2 is therefore indicative for the
existence of such fluctuations in the isotropic phase. Again, T c * is a temperature slightly below T c , at which a second order phase transition is expected to occur. (ii)
Stinson and Litster ( 7 4 ) have measured magnetically induced birefringence in MBBA and have found it obeys a An ~ H 2 / (T - T*) law. This confirms the existence of correlated, optically and magnetically anisotropic regions above T c which can partly be aligned by a magnetic field counteracting thermal motion.
The existence of ordered regions above T c implies that the molecular environment does not change drastically when passing from the mesophase to the isotropic phase. This has recently been confirmed by measurements of the dipole relaxation frequency involving molecular rotation around a short axis which is a probe for the intermolecular potential ( 7 8 ). 3. Electric and Magnetic Field Effects 3.1. Influence on T c The possibility to induce birefringence in a nematogenic substance at T > T c by applying a magnetic field shows that the microscopic degree of order present in the isotropic phase can be influenced by an external field. In addition to that Helfrich (79) has found that also the temperature at which a first order phase transition intervenes with ordering taking place in course of a second order transition phenomena can be influenced by a strong external field. In p-ethoxybenzylidene-p-aminobenzonitrile he has observed that T c increases with the square of an electric field. This finding corroborates a phenomenological thermodynamic theory predicting that an electric field F shifts the first-order transition temperature by the amount AT =—
q
E
"
E M
~E'S
8np
R2
Here q is the heat of transition per unit mass, p the density and e n e m e ,, • With Ae ^ 10, q = 0.63 cal g"1 a field F = 1.2 X 10 s V cm" 1 is required to cause a 1° rise in T c . At this point it shall be mentioned that T c can also be influenced by static pressure. For PAA Deloche, Cabane and Jerome ( 8 0 ) have measured a pressure coefficient 9T c /8p = 3 X 10~2 °C/bar. The effect is a consequence of the fact that the specific sample-volume changes discontinuously at the nematic — isotropic first order phase transition temperature. It is important to note that the value of the ordering parameter S shortly below T c = T c (p) does not depend on pressure p: S (T c ) = 0.42 holds for p = 1 bar to p = 3 kbar. This leads to conclude that first order phase transition from the isotropic to the nematic phase occurs when the pretransitional order, which can be influenced by electric, magnetic or mechanic forces, has reached a critical value. Below T c , S is solely determined by the reduced temperature T/T c . 119
Consequently at a given temperature T < T c S can only be increased by a field which is strong enough to noticeably affect T c . Owing to the small value of the diamagnetic anisotropy even a magnetic field of 10s Oe does not fulfill this requirement ( 81 ). 3.2. Texture changes owing to electric or magnetic anisotropy External fields do not noticably influence the ordering parameter of a mesophase, but they do influence their macroscopic structure defined by the orientation of the preferred axis n 0 . In the following we shall neglect small distortions 5 ii (?) occuring on a microscopic level and confine ourselves to macroscopic effects detectable under the polarizing microscope. Distortions near surfaces As a first example we shall consider the orientation pattern of a nematic structure near a supporting glass surface which is prepared in a way as to impose a L II surfacealignment (see Fig. 11). Assume that a magnetic field H is applied in z-direction, i.e. perpendicular to the glass surface, and that the anisotropy of the diamagnetic susceptibility is positive (Ax >^0). Then the molecules feel a torque trying to rotate them into a position in which L II H. This is possible in the bulk of the sample, but not near the surface. Competition between field- and wall-generated torques creates a transition layer in which L undergoes torsion. The thickness of this layer can be calculated by applying the elastic theory outlined in section 1.3. The components of L can be written as Lx = sin i> (z), Ly = 0, Lz = cos 0 and (z = 0)
H,z 120
=°-
For the sake of simplicity k n = k 3 3 = k shall be assumed. Then the equilibrium condition is 8G -¿T = £ 2 (d 2 4> / d z 2 ) + sin $ cos $ = 0 9 which can be solved to give tan ($/2) = exp ( - z/£). The parameter S - H " 1 (k/Ax)'/ 2
(9)
represents a critical length determining the thickness of the transition layer. It is a measure for the spatial extent of a local distortion of the orientation pattern and as such an analog to the correlation length describing fluctuations in the isotropic phase (eq. 8). For k « 10" 6 dyn, Ax « 10" 7 cgs units and H = 104 Oe £ » 3 ju is obtained. An analogous calculation can be carried out for electric fields yielding % = F _ 1 (4 7r k / A e ) l l 2 , Ae denoting the anisotropy of the dielectric constant. At lowfrequent fields Ae is typically of the order of 1. Hence, for F = 10 4 v cm - 1 = 33 cgs units £ = 1 /x is found. The inverse relationship between field and thickness of the boundary layer is of importance if a relatively thin sample has to be aligned by an external field. An example is the Freedericksz-transition ( 8 2 ): A nematic liquid crystal is held between two parallel glass plates in a distance d by capillary action. In the field-off state L shall be perpendicular to the supporting surfaces (xy-plane) throughout the bulk of the sample. Let H be a magnetic field applied parallel to the xy-plane and assume Ax > 0. A treatment analogous to that presented above shows that the original structure remains undistorted until £ (H) < d/w is reached: Defining $ = 3- (L, z), it is $ = 0 for Hd < H c d = 7r(k/Ax) 1/2 . At H = H c the function $ ( H ) has a discontinuity, the molecular orientation starts to follow the applied field. With increasing H the maximum distortion angle approaches 7t/2. The change in the orientation pattern at H c d = const, manifests itself in an abrupt change in the birefringence. Observation of an electric-field-induced Freedericksz-transition requires en > e £ . The essential feature is that it occurs above a critical voltage, as long as the sample dimensions are small enough to ensure homogeneous sample orientation by wall forces.
Alignment-Inversion walls Under certain circumstances field-induced metastable or even stable distortions in the orientation pattern can be observed also in the bulk of a relatively thick specimen. Consider a thick sample in the field-off state. Its microscopic appearance is non-uniform since minute temperature differences cause convection and therefore destroy uniform alignment (*). If a magnetic field is applied, the state of minimum free energy correponds to a L II H alignment, provided that Ax > o. Envisage a situation where 121
prior to application of the field two neighboring local regions exist in which L is almost parallel to H, which, however, are separated by a region in which L undergoes a IH-orientation.Helfrich ( 8 3 ) has shown that such a conformation may be stabilized by moderate magnetic fields giving rise to so-called alignment inversion walls, in which two L II H regions are separated by a L 1 H zone. This is equivalent to a rotation of L by 180° between the two regions. Examples are shown in Fig. 12. A Bloch-wall is the ferromagnetic analog to the situation depicted in 12a, a Neel-wall is the analog to case 12b. The width of these walls, - again a correlation length -defined by the distance over which the direction of L rotates by 90° is a function of H, numerically d , / 2 = 1.76 H - ' ( k / A x ) 1 ' 2 . For H = 500 Oe a typical value is d , / 2 » 100 /u.
\iI/ T-
O \
-S s
--Ml,'/
s
a) "Bloch"-wall
41
\ I/ ' n V> i / / V
- ^ v
Alignment Inversion walls (modified after Helfrich i 8 3 ))
b) "Neel"-wall
"Color switching" effect Assume a nematic structure with e „ > e_L held between conducting glass electrodes in a L II surface orientation. According to the above considerations a 90° change of the alignment in the bulk can be achieved by applying an electric field. Assume further that the constituting molecules are dichroic. This is usually the case, since the lowest optical transitions of elongated molecules are normally long axis-polarized. Consequently in the field-on state (LII F) optical absorption will be reduced compared with the field-off state if the light beam is perpendicular to the sample. The dichroic molecules need not to be the matrix molecules themselves, they can also be elongated solute dye-molecules which are aligned by the anisotropic matrix. This allows adjustment of the wavelength of maximum color-response to a special application problem ( 8 4 ) . The contrast ratio, i.e. the ratio of the optical densities in off and on state is limited by the degree of molecular alignment expressed in terms of the ordering parameter. It can be less for the solute than for the solvent molecules. Typically OD 0 tr/ O D o n < 2 . The response time of such "color switching" displays is in the 1 . . . 100 msec range. The effect can be applied to study the polarization of optical transitions
( 8 5 )122
Fig. 13
ziF) ;
Influence of an electric field on the mole-
LÌ
cular arrangement in a cholesteric structure. a) F i h , b) F II h. b)
Cholesteric-nematic
phase
transitions
An electric or magnetic field interacts with a cholesteric structure and can cause its destruction of the helical spiral, thus converting the cholesteric into a nematic structure. Two cases have to be distinguished: (i)
xM — < 0 or e„ - e L < 0, i.e. L tends to align perpendicular to an external field. Since L 1 h, a stable macroscopic configuration will be one with the helix axis h parallel to the field. Therefore the field aligns the helix axis leaving the helical microstructure undistorted.
(ii)
Of greater interest is the situation x M ^ Xj. > ^ or e „ - e i > 0. x „ - x x > 0 is realized in solutions of a solute with finite twisting power in a nematic matrix having positive diamagnetic anisotropy. e M > 0 requires the components of the permanent dipole moment to fulfill the inequality p. n> ju . Examples are the cholesterylhalides, whereas cholesterylesters give e „ < e± , mainly as a result of the contribution of the carbonylbond. To separate the effects of helix distortion and helix alignment we shall in the following assume that the sample is thin enough to ensure a groundstate alignment hisurfacc (plane texture) ( 8 5 a ) . Then two cases must be considered (see Fig. 13):
F 1 h: An electric field exerts a torque m = ju X F on ju which tends to rotate the molecules within planes 1 h to finally become parallel to F. It may therefore be expected that above a critical field F c ± the helical structure will be unwound. In an intermediate field range an elliptically distorted structure will be stable. 123
F1 h: The field tends to rotate L towards the helix axis h. Again the helical structure will become unstable above a critical field FcM, a nematic structure being established. The process can be visualized by considering a cholesteric structure being squeezed through a funnel. For F s F c „ conical perturbation of the structure might be expected to occur. Complications arise if the condition of a surface stabilized direction of h is dropped. Since p. „ > ju± is assumed, e l h > e ,|h holds for the dielectric constants in directions Ih and II h. Then the field first rotates h into a position h i F and subsequently unwinds the structure under the condition F 1 h, unless the elastic constants k22 and k 33 fulfill the inequality k 2 2 /k 3 3 > \ (86). Helical unwinding can occur if the gain in electrostatic energy —(em — £choi) F 2 /8tt overcompensates the helical binding energy which, according to eq. 3, is (1/2) k 22 (2 7r / Z) 2 . e u is the dielectric constant of the aligned nematic phase. The dielectric ¡uiisotrogy Ae = e h - echoi depends on whether helical destroy proceeds under FII h or F i h —conditions. F c = ( 2 t t / Z ) (4 7r k 2 2 /Ae)" 2
(10)
immediately follows for the critical field. Note the similarity of eq. 10 and the definition of the coherence length (eq. 9). In this calculation it has implicitly been assumed that the helical structure is unaffected by the field as long as F < F c . This, however, is unlikely to be fulfilled, as may be seen from Fig. 13. An exact theory taking into account pretransitional distortions, has been developed by DeGennes for the case F l h ( 86 ). (The original calculation is for magnetic fields). He has described the cholesteric structure by Lx = cos (z), L y = sin (z), Lz = 0 where (z) F =o = (27t/Z) z. h is assumed to be parallel to the z-axis of a cartesian coordinante system. Taking the applied field along the y-direction, the elastic free energy of the system becomes
g-4[M») - 2n\Z, ,
AE
. F sin 4n
$ dz .
Minimizing G with respect to yields the functional dependence Z (F): Z (F)/Z 0 begins to increase at a reduced field F/F c = 1/2 and diverges logarithmically for "X „2 /A-nV- \ 1/2 Fr = ¿o \e„ eLk/ Z 0 is the pitch of the undisturbed structure. The case F II h has been treated by Meyer ( 87 ). He arrived at the conclusion that phasetransition occurs at a field strength p
124
_ 2jt I --ii Z0 V I k K,J 33/
Ve,,-e,,./
A conically perturbed structure is predicted to be stable in the field range 0^33 /k 22 ) F c < F < F c . Contrary to the case F 1 h, where pretransitional unwinding occurs, conical distortion is accompanied by tightening of the helical structure. In particular, Z (F) is predicted to decrease in a linear fashion: For F < (k 33 /k 22 )F c n , Z (F) = Z 0 is expected, provided that k 22 > k 3 3 . Formation of the nematic phase corresponds to Z (F) approaching zero. In thick samples where h can be oriented by the field, the conically perturbed structure is stable only if k 2 2 /k 3 3 > n 2 /4 is fulfilled i 8 6 ). Otherwise an alignment h IIF becomes energetically unfavorable. Cholesteric-nematic phase transitions have first been observed by Sackmann et. al. ( 88 ) in the case of a magnetic field and by Wysocki et. al. ( 8 9 ) in the case of an electric field. The latter authors have shown that above a critical field an originally cholesteric phase goes from a state of negative to a state of positive birefringence. The first quantitative check of the F c ~ Z _1 relationship was presented by Baessler and Labes (90) using a compensated cholesteric structure with strongly temperature dependent pitch (Z (T) = 4.0 X 10~3/(T - T n e m ) cm and T n e m =42 + 3 °C). In a temperature range where for constant applied field Z (T) > const x F"1 was fulfilled the material was identified to be nematic. In the same temperature range the dc-conductivity showed an increase of about 50 percent. This can be interpreted as a mobility-effect: Viscosity data show (see section 1.1) that fastest molecular motion occurs in a direction parallel to the long molecular axis. Since the mobility of impurity ions, which are responsible for charge transport, is related to the viscosity TJ by Stoke's law ju = e I (6 ir rj r), r being the ion radius and e the elementary charge, an increase of n must occur, if the system is converted from a state, in which L is either 1 F or — on a macroscopic level — statistically distributed, to a state with homogeneous orientation L IIF. The anisotropy of the mobility is a consequence of the uniaxiality of the structure and hence an inherent property of the liquid crystalline state. Meanwhile it has been confirmed by a number of workers that (i) in a thick sample with positive susceptibility anisotropy the helix axis aligns perpendicular to an electric ( 9 1 ) or a magnetic ( 9 2 ) field and (ii) that in corroboration of DeGennes theory Z (F) respectively Z (H) diverges logarithmically at a field strength given by eq. 11 (91-94) (see Fig. 14). Moreover, Luckhurst and Smith (95), utilizing the ESR spectrum of a nitroxide radical with a structure analogous to that of the cholesteric matrix, have confirmed the predictions of continuum theory regarding changes in the molecular distribution within the helical structure in the magnetic field range 0.5 < (H/H c ) < 1. Baessler and Labes (*7>93,96) have also investigated the case FII h in a sample where Z 0 /d< 4, d denoting the sample thickness, which ensured h 1 surface alignment throughout the bulk of the sample. They have used the field dependence of both the low-frequency dielectric constant and the optical rotatory power as a probe to demonstrate that conical distortion of the helical structures occurs and that it is accompanied by a decrease in pitch. The results are in qualitative agreement with recent studies by Gerritsma and v. Zanten (97). 125
Fig. 14 E l e c t r i c - f i e l d - i n d u c c d c h a n g e o f the p i t c h o f a 1.75 : 1.00 eholesterylchloride-cholesterylm y r i s t a t e m i x t u r e (F 1 h). ( Z 0 = 2.8 ii). ( A f t e r Baessler
et. al. ( 4 7 ) ) .
Finally Baessler and Labes ( 3 0 ) have demonstrated that interaction between an electric field and the component /}„ of the permanent dipole moment is responsible for helical unwinding. They have observed that a phase-transition can also be accomplished by ac-fields up to frequencies which are of the order of the dipole relaxation frequency f r associated with /2U . In particular, the relationship 1/2
c(f) = Fc ,
dc
1+ Mr
(13)
which follows from the Debye relaxation theory was experimentally verified. In accord with eq. 12 lim F c a c = F c d c is fulfilled indicating the absence of collective dipole orientation effects occurring at low frequencies. This represents a strong argument against ferroelectric ordering. Dynamic
scattering
Owing to its practical importance for the development of electrooptical devices, dynamic scattering, discovered by the RCA liquid crystal group ( 9 S ), has become perhaps the most "popular" of all liquid crystal effects. Before embarking to its explanation a brief phenomenological description shall be given. Upon applying a static or low-frequent electric field to an aligned and therefore almost clear sample of a certain class of nematic liquid crystals its transparency for non-absorbed white light is reduced, the sample becomes opaque. The intensity in a parallel lightbeam, for instance, is reduced by more than one order of magnitude after passing a ' turned-on" sample. The effect is even higher with polarized coherent radiation ( 1 0 0 ). Using a cell with a specularly reflecting back electrode it is easily verified that the effect is due to 126
light scattering: In field-off state the sample appears dark upon viewing in a direction parallel to the incident light, and white in the field-on state. With diffused light reflective contrast ratios of better than 15:1 with efficiencies of 45 percent of the standard white (MgC0 3 ) have been demonstrated. Field application to definite points of the sample allows image production. Since the ordering parameter S of a nematic is practically uninfluenced by an external field, the observed scattering effect cannot be due to field-modulation of the fluctuation modes which are responsible for quasi-elastic Rayleigh-scattering (section 2). Instead, the field must produce distortions in the orientation pattern of the structure acting as scattering centers which are large compared with the wavelength of the incident light. Hence the turbidity of a nematic in the "dynamic scattering mode" has a similar origin as the turbidity of a thick, nonuniform sample. Deutsch and Keating ( " ) have treated this type of scattering theoretically and have found it to be due to both amplitude and phase modulation by long-wavelength orientational fluctuations. This explains why coherent radiation is scattered more effectively than incoherent. Williams ( l 0 ° ) has discovered that field-induced light scattering is intimately connected with the appearance of a regular domain pattern visible unter the microscope (Fig. 15). It shows up above a threshold voltage V th ~ 5 v applied across a sample 10 to 100 n thick. The domain width is of the same order of magnitude as the sample
Fig. 15. Field-induced d o m a i n p a t t e r n in PAA. To the right there is no field. ( A f t e r Williams
(100))
127
thickness. Further increase of the voltage causes the stationary pattern to become turbulant ( 1 e u is a necessary condition for its occurrance. This means that L 1 F — alignment in an electric field is to be expected as long as its frequency is below the dipole relaxation frequency f r , which is around 100 MHz for PA A ( 102 ). This is in striking disagreement with the experimental result: At frequencies below about 10 kHz "anomalous alignment" characterized by Lll F is found 1 ). This observation has caused considerable confusion in the older literature ( 4 ). Tsvetkov and Mikhailov (104) were perhaps the first to propose that it could be due to conductivity anisotropy resulting from an anisotropy of the mobility. Following this suggestion Carr ( 21 ) has contributed the essential idea for an understanding of the effect. Based on detailed studies of molecular alignment under the counteracting influence of simultaneously applied magnetic and electric fields ( 2 1 , 1 0 s > 106 ) he has proposed that anomalous alignment, which in general is less perfect than normal alignment, is due to the counteraction of oppositely directed torques. One of the torques results from the interaction of the permanent molecular dipole moment with the electric field. It tends to produce a L 1 F alignment, independent of frequency as long as f < f r . It is this torque which is responsible for alignment properties discussed in previous sections. The second torque is due to the interaction between the field and an induced moment which stems from ionic interfacial polarization generated by the external field. Motion of the charge-dipole is associated with a torque which in turn tends to rotate the preferred axis of the material within the space charge region into a direction parallel to the external field.
/
/
/
/ /
/
N \
"
y
' '
\
? ©\
- ®>
\
\ \
\
Fig. 16 Build-up of interfacial spacecharge. (Modified after Helfrich ( 1 0 7 )). d indicates the angle between the applied field and the local preferred axis.
Anomalous alignment has recently been observed also with a smectic phase ( 1 0 3 ) .
128
Following Helfrich ( 1 0 7 ) build-up of space charge regions can be visualized in terms of Fig. 16. Assume that in the field-free state the nematic structure is not perfectly aligned. Owing to the anisotropy of the ionic mobility charge flow immediately after application of a small external field will preferentially occur in a direction parallel to the local preferred axis. The local current is therefore composed of two components!]^ I = a „IF! cos & a n d l j ^ J = aJF| sin i? where # = ^ ( n o , F). a„and are the conductivity values parallel and perpendicular to no. Hence j = ] „ + . Since a „ > V t h turbulance may occur, Note that the absolute magnitude of the conductivity does not enter eq. 13 explicitly, although there must be some critical conductivity value below which there would not be enough ions to create the space charge necessary to produce conduction-induced torque. With conventional purification procedures, however, it is difficult to achieve conductivities — conduction is impurity-dominated — below l ) In a quantitative treatment also the influence of the space charge field on dielectric polarization has to be considered ( 1 0 7 )
9 Festkôrperprobleme XI
129
10"10 S2"1 c m - 1 , at least in low-viscosity liquid crystals. This value still seems to be above critical limit. Inserting the data k J = 0.03 g cm - 1 s" 1 , r^ = 0.092 g cm - 1 s" 1 , e =5.62,e =5.83, a /a « 1.5, k 3 3 = 1.7 x 10"6 dyn for PAA into eq. 13 yields V t h = 5.3 v at 120 °C, which compares favorably with the experimental value Vth, e x p = 3 . . . 5 v. The rise and decay time, after which a distortion pattern appears and disappears upon turning the voltage on or off, is of course much slower than the space charge relaxation time, because it involves structural relaxation which is determined by the hydrodynamic properties of the material. Usually the rise time is in the msec range, the decay time one order of magnitude higher. Recently, however, also orientational oscillations have been discovered which are in the kHz range and which have turnoff times < 3 msec ( 10S ). These oscillations probably represent standing orientational waves. The authors have interpreted the effect in terms of parametric excitation. To conclude, it shall be mentioned that light scattering centers can also be created by field-stimulated coagulation in a mixture of 90 percent nematic anisylidene-paminophenylacetate (APAPA) and 10 percent cholesterylnonanoate ( 109 ). Coagulation is brought about by conduction-induced shear. The essential new feature is that the centers remain stable over hours after removing the generating field. The material can be returned to its clear state by applying an audio-frequency signal of a frequency > a I ee0 producing alignment without involving space charge effects. The effect can be used in electro-optic memory devices. For a discussion of high resolution nuclear magnetic resonance in liquid crystalline phases, a topic which also belongs to the section "field-effects", the reader is referred to the excellent reviews given by Saupe (') and Meiboom and Snyder (").
References (Note: The abbreviation „Berlin 1970" refers to papers presented at the Illrd International Liquid Crystal Conference, held in Berlin 1970. Part of the papers will be published in the 1971 iussues of MoL Cryst. and Liquid Cryst.) (1) (2)
A Saupe, Ang. Chem. 80, 99 (1968), Intern. Ed. (engl.) 7, 97 (1968). /. G. Chistyakov, Sov. Phys. Usp. 9, 551 (1967).
(3)
J. L. Ferguson, Sei. Amer. 211, 76 (1964), 222, (1970).
(4)
G. W. Gray, Molecular Structure and the Properties of Liquid Crystals, Academic Press, London 1962.
130
(5) (6) (7) (8) (9) (10) (11) (1 2 ) (13) (1 4 ) (is) (15a)
A list of mesophase-forming materials has appeared in Intl. Critical Tables p. 314. W. Maier and A. Saupe, Z. Naturforschg. 13a, 564 (1958), 14a, 882 (1959). I. Freund and P. M. Rentzepis, Phys. Rev. Letters 18, 393 (1968). G. Durand and C. H. Lee, MoL Cryst 5, 171 (1968). L. S. Goldberg and J. M. Schnur, AppL Phys. Letters 14, 306 (1969). W. Maier and A. Saupe, Z. phys. Chem. 6, 327 (1956). W. Maier and G. Englert, Z. Phys. Chem. 13, 251 (1957). W. Haas, J. Adams and J. B. Flannery, Phys. Rev. Letters 25, 1326 (1970). P. Delord and J. Falgueirettes, Compt Rend. 267C, 1177 (1968). I. G. Chistyakov and V. M. Chaikovskii, Sov. Phys. Cryst 12, 770 (1968). A. de Vries, MoL Cryst and Liquid Cryst 11, 361 (1970). N. M. Amer, Y. R. Shen and H. Rosen, Phys. Rev. Letters 24, 718 (1970). A Saupe and W. Maier, Z. Naturforschg. 16a, 816 (1961). R. S. Porter and J. F. Johnson, Rheology 4, 317 (1967), and J. Am. Chem. Soc. 66, 1826 (1962). J. L. Erickson, Appl. Mech. Rev. 20, 1029 (1967). F. M. Leslie, Quart. J. Mech. AppL Math. 19, 337 (1966). M. Miesowics, Nature 158, 27 (1946). E. F. Can, MoL Cryst. and Liquid Cryst. 7, 253 (1969) and Advan. Chem. Ser. 63, 76 (1967). I. Teucher, H. Baessler and M. M. Labes, Nature, physical sciences 229, 26 (1971). A. E. Lord and M. M. Labes, Phys. Rev. Letters 25, 570 (1970). A good review on magnetic properties of liquid crystals is by P. Pincus, J. AppL Phys. 41, 974 (1970). G. Foex, Trans. Faraday Soc. 29, 958 (1933). T. M. Laronge, H. Baessler andM. M. Labes, J. Chem. Phys. 51, 4186 (1969). IV. Maier and G. Meier, Z. Naturforschg. 16a, 262 (1961). W. Maier and G. Meier, Z. Naturforschg. 16a, 170 (1961). R. Williams and G. Heilmeier, J. Chem. Phys. 44, 638 (1966). H. Baessler a n d M . M. Labes, J. Chem. Phys. 51, 5397 (1969). G. Friedel, Ann. Phys. 18, 273 (1922). R. Dreher, G. Meier and A. Saupe, Berlin 1970. H. de Vries, Acta Cryst 4, 219 (1751). J. L. Fergason, MoL Cryst. 1, 293 (1966). H. Baessler and M. M. Labes, MoL Cryst. and Liquid Cryst. 6, 419 (1970). D. W. Beneman and T. J. Scheffer, Phys. Rev. Letters 25, 577 (1970). E. Sackmann, S. Meiboom, L. C. Snyder, A. E. Meixner and R. E. Dietz, J. Am. Chem. Soc. 90, 3567 (1968). R. Kassubek and G. Meier, MoL Cryst and Liquid Cryst. 8, 305 (1969). R. Cano, BulL Soc. MineraL Franc. 91, 20 (1968). F. Grandjean, Compt Rend. 172, 71 (1921). H. Baessler andM. M. Labes, J. Chem. Phys. 52, 631 (1970). J. Adams and W. Haas, Berlin 1970. R. Cano and P. Chatelain, Compt Rend. 259B, 252 (1964). 131
(44)
V. N. Alexandrov and I. G. Chistyakov, MoL Cryst. and Liquid Cryst. 8, 19 (1969). The departure from linearity at low concentrations in the K(c) — relationship has meanwhile been shown to be an artifact 4 5 .
(45)
W. J. A. Goossens, MoL Cryst and Liquid Cryst. (in press) and Physics Letters 31 A, 413 (1970). J. Adams and L. Leder, Chem. Phys. Letters 6, 90 (1970).
(46) (47) ("8) (49)
(57)
H. Baessler, T. M. Laronge and M. M. Labes, J. Chem. Phys. 51, 3213 (1969). P. N. Keating, MoL Cryst. and Liquid Cryst. 8, 315 (1969). H. Baessler, P. A. G. Malya, W. R. Nes andM. M. Labes, MoL Cryst. and Liquid Cryst. 6, 329 (1970). G. Durand, C o m p t Rend. 264B, 1251 (1967). J. L. Fergason, N. N. Goldberg and R. J. Nadalin, MoL Cryst 1, 105 (1966). R. D. Ennulat, Berlin 1970. J. L. Fergason and R. D. Ennulat, Berlin 1970. see for instance G. Baur, N. Riehl and P. Thoma, Z. Phys. 206, 229 (1967). H. Sackmann and D. Demus, MoL Cryst. 2, 81 (1966); H. Arnold, D. Demus and H. Sackmann, Z. Phys. Chem. 222, 15 (1963). H. Arnold, MoL Cryst 2, 63 (1966), Z. Phys. Chem. 226, 146 (1964), H. Arnold and R. Roedige, Z. Phys. Chem. 231, 407 (1966). H. Zocher, Z. Phys. 28, 790 (1927).
(58) (59) (6°)
C. W. Oseen, Trans. Faraday Soc. 29, 883 (1933). C F. Frank, Disc. Faraday Soc. 25, 19 (1958). A Saupe, Z. Naturforschg. 15a, 815 (1960).
(«) (62) (63) (64) (65)
V. Zwetkov, Acta Physicochim. USSR 18, 358 (1943). W. Helfrich, J. Chem. Phys. 50, 100 (1969). J. E. Adams, W. Haas a n d / . J. Wysocki, J. Chem. Phys. 50, 2458 (1969). E. M. Barrall II and M. A. Sweeney, MoL Cryst 5, 257 (1969). M. B. Rhodes, R. S. Porter, W. Chu and R. S. Stein, MoL Cryst. and Liquid Cryst. 10, 295 (1970). P. Chatelain, Acta Cryst 1, 315 (1948). L. S. Omstein and W. Kast, Trans. Faraday Soc. 29, 931 (1933).
(so) (S1) (") (53) (54) (55) (5«)
(««) (67) (68) (69)
P. G. DeGennes, MoL Cryst. and Liquid Cryst. 7, 325 (1969) and Physics Letters 30A, 454 (1969). Groupe D'etude des Cristaux liquides (Orsay); J. Chem. Phys. 51, 816 (1969).
(70) ( 7 1) (72)
Orsay Liquid Crystal Group, Phys. Rev. Letters 22, 1361 (1969). I. Hatter and J. D. Litster, Phys. Rev. Letters 25, 1550 (1970). P. G. DeGennes, Compt. Rend. 266B, 15 (1968).
(73) (74) (75) (76) (77) (78) (79) (80)
J. D. Litster and T. W. Stinson III, J. AppL Phys. 41, 996 (1970). T. W. Stinson III and J. D. Litster, Phys. Rev. Letters 25, 503 (1970). W. Maier and A Saupe, Z. Naturforschg. 15a, 287 (1960). B. Cabane and W. G. Clark, Phys. Rev. Letters 25, 91 (1970). P. Pincus, Solid State Comm. 7, 415 (1969). H. Baessler and M. M. Labes, J. Chem. Phys. 52, 2292 (1970). W. Helfrich, Phys. Rev. Letters 24, 201 (1970). B. Deloche, B. Cabane and D. Jerome, Berlin 1970.
132
(81) (82) (83) (84)
P. Chatelain, BulL Soc. MineraL franc. 50, 280 (1937). V. K. Freedericksz and V. Zolina, Trans. Faraday Soc. 29, 919 (1933). W. Helfrich, Phys. Rev. Letters 21, 1519 (1968). G. H. Heilmeier and L. A. Zanoni, AppL Phys. Letters 13, 91 (1968).
(85) (8Sa)
E. Sackmann and D. Rehm, Chem. Phys. Letters 4, 537 (1970). W. Helfrich, Appi. Phys. Letters 18, 527 (1970)
(»«) (87) (88) (89) (90) (91)
P. G. DeGennes, Solid State Comm. 6, 163 (1968). R. B. Meyer, AppL Phys. Letters 9, 281 (1968). E. Sackmann, S. Meiboom and L. C. Snyder, J. A. Chem. Soc. 89, 5982 (1967). J. J. Wysocki, J. Adams and W. Haas, Phys. Rev. Letters 21, 1791 (1968). H. Baessler and M. M. Labes, Phys. Rev. Letters 21, 1791 (1968). F. J. Kahn, Phys. Rev. Letters 24, 209 (1970).
(92) (93) (94)
R. B. Meyer, AppL Phys. Letters 14, 208 (1969). H. Baessler, Habilitationsschrift, Munchen 1970. G. Durand, L. Leger, F. Rondolez and M. Veyssie, Phys. Rev. Letters 22, 227 (1969).
(95) ( 9 6)
G. R. Luckhurst and H. J. Smith, Berlin 1970. H. Baessler andM. M. Labes, J. Chem. Phys. 51, 1846 (1969).
(97) (98) (")
G. J. Gerritsma and P. v. Zanten, Berlin 1970. G. H. Heilmeier, L. A. Zanoni and L. A. Barton, Proc. IEEE 56, 1162 (1968). C. Deutsch and P. N. Keating, J. Appi. Phys. 40, 4049 (1969).
(10°)
R. Williams, J. Chem. Phys. 39, 384 (1963).
(>oi) (102) (103) (104) (105) (106) (107) (108) (10 9 ) (no)
A. Prinz, Berlin 1970. G. Meier and A. Saupe, Mol. Cryst 1, 515 (1966). £ F. Carr, Phys. Rev. Letters 24, 807 (1970). v. N. Tsvetkov and G. M. Mikhailov, Acta Physicochim. USSR 8, 77 (1938). £ /r Carr, J. Chem. Phys. 38, 1536 (1963) and 39, 1979 (1963). p. Twitchell and E. F. Carr, J. Chem. Phys. 46, 2765 (1967). W. Helfrich, J. Chem. Phys. 51, 4092 (1969). G. H. Heilmeier and W. Helfrich, AppL Phys. Letters 6, 155 (1970). G. H. Heilmeier and/. E. Goldmacher, Proc. IEEE 57, 34 (1969). S. Meiboom and L. C. Snyder, Science 162, 1337 (1968).
133
Festkörperprobleme X I ( 1 9 7 1 )
Dynamische Eigenschaften der Festkörperoberfläche Harald Ibach 2. Physikalisches Institut der Technischen Hochschule Aachen
Summary: This paper gives an introduction to some vibrational properties of solid surfaces from the experimental point of view. In section 2. different types of surface vibrations are classified and the possibilities of their experimental detection are discussed. Theoretical calculations and experimental results on the mean square amplitudes of vibration at the surface are reviewed in section 3. Some information about the chemical bond and surface structure of adsorbed atoms or molecules may be drawn from the frequencies of their localized modes (section 4). Emphasis is put on optical surface phonons in infrared active materials (section 5). Their interaction with light and electrons seems to be understood now. Some results of the author on the inelastic scattering of low energy electrons from surface phonons, which have not been published before, are presented in section 6. Zusammenfassung: Die Arbeit gibt eine Einführung in Schwingungseigenschaften der Festkörperoberfläche vom Standpunkt des Experimentalphysikers. In Kapitel 2 werden die verschiedenen Arten von Oberflächenschwingungen erläutert und Möglichkeiten fur ihre experimentelle Untersuchung diskutiert. Theoretische Berechnungen und experimentelle Ergebnisse über das mittlere Amplitudenquadrat der Schwingung von Oberflächenatomen werden in Kapitel 3 zusammengefaßt. Aus den Frequenzen lokalisierter Schwingungen von adsorbierten Atomen und Molekülen können Informationen über Bindung und Struktur gewonnen werden (Kapitel 4). Besondere Betonung liegt auf den optischen Oberflächenphononen an infrarotaktiven Materialien (Kapitel 5). Ihre Wechselwirkung mit Licht und Elektronen scheint verstanden zu sein. Einige bisher noch nicht publizierte Ergebnisse des Autors über die inelastische Streuung von langsamen Elektronen an Oberflächenphononen werden in Kapitel 6 dargestellt.
1. Vorbemerkung Dies ist ein Bericht über ein Gebiet, welches als Arbeitsgebiet des Experimentalphysikers erst im Entstehen begriffen ist. Beiträge dazu sind von vielen Seiten jeweils unter unterschiedlichen Aspekten von Forschern geleistet worden, die sich untereinander z. T. nicht einmal aus der Literatur kennen. Es ist das Ziel dieses Berichtes, den an Oberflächen interessierten Experimentalphysikern eine Einsicht in die bisher geleistete Arbeit zu geben. Einzelarbeiten werden deshalb nur zitiert und besprochen, sofern ihre Ergebnisse in dem Gesamtzusammenhang von besonders exemplarischer Bedeutung zu sein scheinen. Im übrigen wird auf die in Teilbereichen erschienenen Übersichtartikel verwiesen. Wo für das Verständnis theoretische Ableitungen erforderlich sind, werden die zugrunde liegenden Vorstellungen qualitativ erläutert und die Ergebnisse an den jeweils einfachsten Beispielen diskutiert. Auf experimentelle Einzelheiten wird nur an der Stelle eingegangen, w o der Autor über eigene Erfahrungen verfügt und nur insoweit, als sie noch nicht an anderer Stelle veröffentlicht wurden. 135
2. Einführung 2.1. Einteilung der Oberflächenschwingungen Schwingungszustände an Festkörperoberflächen stehen in gewisser Analogie zu den elektronischen Zuständen an der Oberfläche. In beiden Fällen handelt es sich nach der Definition um Zustände, bei denen die Erregung bzw. die Aufenthaltswahrscheinlichkeit der Elektronen an der Oberfläche lokalisiert sind. Oberflächenschwingungen können daher in ähnlicher Weise klassifiziert werden wie elektronische Zustände. Man unterscheidet zwischen Eigenzuständen der freien Festkörperoberfläche („intrinsischen" Zuständen) und solchen, die durch chemiesorbierte Atome erzeugt werden. Da für die reine Oberfläche eines Festkörperkristalles auch im realen Fall eine zweidimensionale Periodizität in guter Näherung verwirklicht ist, — von Stufen und Ecken, die ihr eigenes Schwingungsspektrum haben, soll also abgesehen werden — sind die Lösungen der Bewegungsgleichungen des Gitters parallel zur Oberfläche ebene Wellen, und die zugehörigen Quanten werden deshalb als Oberflächenphononen bezeichnet. Einzeln aufgebrachte Fremdatome erzeugen dagegen Schwingungen, die in allen drei Dimensionen lokalisiert sind. In Analogie zu Eigenschwingungen von Volumenstörstellen würde man hier von lokalisierten Schwingungen sprechen. Der Unterschied zu den Oberflächenphononen ist jedoch gleitend, da bei zunehmender Bedeckung der Oberfläche mit Fremdatomen sich diese in der Regel zweidimensional periodisch anordnen und schließlich wieder eine Entwicklung nach ebenen Wellen die Bewegungsgleichungen separiert. Die Frequenzen der lokalisierten Schwingungen spalten dabei zu Bändern auf. Im Gegensatz zu den elektronischen Oberflächenzuständen, bei denen die Wellenfunktion in der Regel nicht durch eine ebene Welle dargestellt werden kann, ist bei den Oberflächenphononen noch eine weitere Unterteilung sinnvoll, nämlich die in langwellige und kurzwellige Phononen. Als langwellig werden Oberflächenphononen bezeichnet, wenn die Wellenlänge größer als etwa zehn Gitterkonstanten ist. Wie noch gezeigt wird, sind Frequenz und Dispersion der langwelligen Oberflächenphononen nahezu vollständig von den Gittereigenschaften des Volumens bestimmt und enthalten daher auch keine Information über den mikroskopischen Zustand der Oberfläche. Wie bei den Volumenphononen unterscheidet man darüber hinaus bei Gittern mit mehr als einem Atom in der Elementarzelle zwischen akustischen und „optischen" Oberflächenphononen, je nachdem ob die Frequenz mit der Wellenzahl k gegen Null geht oder einen von Null verschiedenen Wert annimmt. 2.2. Langwellige Oberflächenphononen Die wohl bekanntesten langwelligen Oberflächenphononen sind die akustischen Wellen an der ebenen Grenzfläche eines elastisch isotropen Mediums, die sog. Rayleigh-Wellen (!)• Stonefy ( 2 ) und Gazis, Herman und Wallis ( 3 ) zeigten für ku136
bische Kristalle, daß diese Rayleigh-Wellen den Spezialfall verallgemeinerter RayleighWellen darstellen: Wenn die ebene Grenzfläche durch z = 0 gegeben ist, so lassen sich die Amplitudenkomponenten u¡ der Verschiebung darstellen durch u¡ = Aj exp[-KZ+ i (k£ t | -cot)]
(1)
_r ist ein Vektor in der Oberfläche. Für ein isotropes Medium ist K reell (Rayleigh Wellen), für bestimmte Verhältnisse der elastischen Konstanten in kubischen Kristallen jedoch komplex mit positivem Realteil, so daß die Wellen oszillatorisch ins Innere abklingen (verallgemeinerte Rayleigh-Wellen). Immer ist jedoch K von der Größenordnung von k, d. h. die Eindringtiefe der Erregung von der Größenordnung einer Wellenlänge. Für Wellenlängen, die groß gegen die Gitterkonstanten sind, beschreibt Gleichung (1) also die Bewegung von Gitteratomen, die überwiegend tief im Kristallvolumen sitzen. Die Frequenz einer langwelligen akustischen Oberflächenwelle ist daher durch die elastischen Konstanten des Volumens gegeben. Ähnliche Argumente gelten für langwellige optische Phononen (siehe 5.1). Elastische Oberflächenwellen lassen sich anregen durch piezoelektrische Umwandler. Ihre Anregung läßt sich z. B. beobachten durch die Streuung von Laser-Licht an dem von der Oberflächenwelle an der Oberfläche gebildeten Gitter. An piezoelektrischen Materialien können elektrische Wechselspannungen von einigen hundert MHz durch aufgedampfte Gitter direkt in Rayleigh-Wellen umgesetzt und wieder empfangen werden. Da sich damit Verzögerungsleitungen und Pulswandler herstellen lassen, besteht an den elastischen Oberflächenwellen ein erhebliches technisches Interesse. Eine ausfuhrliche Zusammenfassung der mit der Erzeugung und Anwendung elastischer Oberflächenwellen verbundenen Fragen wurde kürzlich von Dransfeld und Salzmann (4) gegeben. 2.3. Kurzwellige Oberflächenphononen Wird die Wellenlänge der Oberflächenphononen vergleichbar mit der Gitterkonstanten, so tritt wie bei den Volumenphononen Gitterdispersion ein. Die Bewegungsgleichungen für das Gitter mit freier ebener Oberfläche wurden in einigen einfachen Fällen gelöst. Ludwig ( s ) berechnete die Dispersion für Oberflächenphononen in verschiedenen Richtungen am kubisch primitiven Gitter mit ungeänderter Struktur und Federkonstanten bis zur Oberfläche. Für kubisch flächenzentrierte Kristalle bestehend aus 21 Schichten von Atomen, die untereinander durch ein 12—6 Lennard-Jones Potential wechselwirken, berechneten Alldredge, Wette und Allen Dispersionskurven ( 6 ) und Zustandsdichten. ( 7 ) Optische Oberflächenphononen an 15 Schichten NaCl Kristallen wurden von Tong und Maradudin ( 8 ) und Chen, AUen, Alldredge und Wette ( 9 ) berechnet. Trotz gleicher Voraussetzungen unterscheiden sich die berechneten Dispersionskurven beträchtlich. Wie sich schon auf Grund von Gleichung (1) vermuten läßt, und wie AUen et al. ( 10 ) an ihrem Modellkristall gezeigt haben, ist die Bewegung der Atome in einer Ober137
flächenwelle mit einem k-Vektor nahe dem Rand der zweidimensionalen Brillouinzone praktisch auf die obersten zwei Atomlagen beschränkt. Die Frequenz solcher Oberflächenphononen wird daher empfindlich von einer geänderten Struktur und geändertem Bindungszustand der Atome in der Oberfläche abhängen. Wie aus der elastischen Streuung langsamer Elektronen bekannt, zeigen viele Halbleiter und Metalle eine Überstruktur d. h. eine geänderte Periodizität parallel zur Oberfläche. ( n ) Ferner muß mit einer Änderung der interatomaren Abstände senkrecht zur Oberfläche bis zu 10 % ( 1 2 ) und ganz allgemein mit einer Aufweichung der Bindung in der Oberfläche gerechnet werden. Solange keine verläßlichen experimentellen Methoden zur Bestimmung der Atompositionen und Abschätzungen der interatomaren Kräfte in der Oberfläche bekannt sind, ist nicht zu erwarten, daß gitterdynamische Rechnungen ein zutreffendes Bild der Dispersion der Oberflächenphononen liefern. 2.4. Lokalisierte Schwingungen absorbierter Fremdatome Schwingungen von adsorbierten Fremdatomen, meist Gasen auf festem Substrat, sind seit langem aus der Infrarotspektroskopie bekannt. ( 1 3 ) Wegen der relativen Unempfmdlichkeit der konventionellen Infrarot-Absorptionsmessungen war bei diesen Versuchen eine Wechselwirkung mit einer großen Zahl von Streuzentren (ca. 10 1 8 ) erforderlich. Dies konnte z. B. erreicht werden, indem das Substrat, meist Metalle (Pt, Cu, Ni) in fein pulverisierter Form — Korngröße etwa 50—100 Ä — in feinkörnigem Quarz dispergiert und auf einen infrarotdurchlässigen Träger z. B. Ca F 2 aufgebracht wurde. Die Reaktionen des Metalls mit verschiedenen Gasen wurde dann in Transmissionsspektren beobachtet. Das große Interesse an dieser Art Untersuchungen kam von der Tatsache her, daß aus den Schwingungsfrequenzen Rückschlüsse auf den Bindungszustand der adsorbierten Gase als Funktion von äußeren Parametern wie Druck und Temperatur gezogen werden können: Schwach chemisorbiertes CO auf Kupfer (100) zeigt eine Verschiebung der C—O Schwingungsfrequenz von 2170 cm" 1 nach 2085 c m - 1 . ( 1 4 ) Eine Chemisorption unter gleichzeitiger Dissoziation des Moleküls läßt die entsprechende Molekülbande völlig verschwinden. Stattdessen erscheinen Banden der einzeln gebundenen Atome ( 1 S ) (Chemisorption von H 2 auf ZnO). Ferner lassen sich aus der Zahl der auftretenden Schwingungsfrequenzen des Moleküls oder Atoms gegen das Substrat und dem Größenverhältnis der Frequenzen Aussagen über die Symmetrie der Umgebung des Moleküls gewinnen und damit Information über die Position auf dem Substrat (vgl. 4.2). Für solche detaillierten Untersuchungen erscheint es jedoch unbedingt notwendig, unter anderen Bedingungen, an reinen und kristallographisch wohldefinierten Oberflächen zu arbeiten. Es ist bekannt, daß die Chemisorption von Gasen auf Metalloberflächen von der Orientierung der Oberfläche abhängt. ( 1 6 ) Es ist ferner gezeigt worden, daß unter dem Einfluß der Chemisorption Änderungen der Oberflächenstruktur des Substrates hervorgerufen werden ( 17 > 18 ) oder bestimmte Strukturen durch Spuren von Verunreinigungen stabilisiert werden. ( 1 9 ) Auch kann eine Ände138
rung des Bindungszustandes des Absorbates mit zunehmendem Bedeckungsgrad noch unter einer Monoschicht auftreten. ( 14 ) Beim Arbeiten an reinen Oberflächen von höchstens einigen cm2 Fläche und mit Bedeckungen von unter einer Monoschicht stehen nur etwa 1014—1015 Streuzentren zur Verfügung. Die konventionellen spektroskopischen Methoden zur Messung von Schwingungsspektren versagen hier. Doch sind in den letzten Jahren empfindlichere Methoden entwickelt worden. Sie lassen Untersuchungen, die von reinen Oberflächen ausgehen, aussichtsreich erscheinen. 2.5. Experimentelle Methoden Eine theoretisch einfache Möglichkeit, die Oberflächenempfindlichkeit der Infrarotspektroskopie zu erhöhen, bietet bei schwach absorbierenden Substraten die Anwendung vielfacher innerer Reflexion mit einem Reflexionswinkel nahe der Totalreflexion. (20) Abschätzungen gemessener Spektren z. B. anhand der Ge-0 Bande von thermisch oxidiertem Germanium zeigen, daß für eine Aufnahme von Schwingungsspektren von einer Monoschicht etwa 200 Reflexionen nötig sind. (21) Innere Reflexionselemente mit einer großen Zahl von Reflexionen erfordern große Kristalle und eine hohe Präzision der Bearbeitung. Dies schränkt die Möglichkeit der Anwendung auf den hier interessierenden Problemkreis stark ein. Eine interessante Variante, die auf stark absorbierende Substrate (Metalle) anwendbar ist, wurde von Greenler ( 22 ) vorgeschlagen. Die Nachweisempfindlichkeit von Molekülschwingungen an Oberflächen bei einer äußeren Vielfachreflexion ist bestimmt durch die Größe des elektrischen Feldes an der Oberfläche. Bei senkrechter Inzidenz ist dieses Feld bei stark absorbierenden Substraten wie Metallen praktisch gleich Null. Bei streifendem Einfall kann jedoch für parallel zur Einfallsebene polarisiertes Licht der Phasensprung bei der Reflexion 90° betragen und deshalb eine von Null verschieden resultierende Feldkomponente übrig bleiben. Dies führt zu einer Verstärkung der Absorption bis zu einem Faktor von 5000 im Maximum der Verstärkung bei 88° Einfallswinkel. Damit lassen sich für mittlere Oszillatorstärken Absorptionskoeffizienten von etwa 5 • 10~3 pro Monoschicht und Reflexion erreichen. Die Höhe des Verstärkungseffektes hängt ab vom Absorptionskoeffizienten des Substrates und verschwindet praktisch für Absorptionskoeffizienten kleiner als 10. Der Verstärkungseffekt wurde von Pritchard und Sims experimentell nachgewiesen. (23) Mit dieser Methode konnten Pritchard et al. Schwingungsspektren von auf Kupfer chemisorbiertem CO bis zu einer Bedeckung von ca. 1/10 Monoschicht mit nur einer Reflexion nachweisen. Eine grundsätzlich verschiedene Möglichkeit, Oberflächenschwingungen zu messen, bietet die inelastische Streuung von Teilchen. Im Gegensatz zu Licht können Teilchen bei der inelastischen Streuung nennenswerte Impulsbeträge aufnehmen. Eine gleichzeitige Messung von Energieverlustspektrum und Winkeländerung bei der Streuung erlaubt daher grundsätzlich auch die Messung von Disperisonskurven von Oberflächenphononen, vorausgesetzt der Streuquerschnitt ist hinreichend groß, so daß 139
die Streuung überwiegend an oberflächennahen Atome erfolgt (vgl. inelastische Streuung von Neutronen). Neben den langsamen Elektronen kommen auch leichte Edelgasatome als geeignete Teilchen in Frage. ( 2 4 ) Für die inelastische Streuung durch Phononen an Oberflächen gelten dann Energieund Impulssatz ( 2 S ) : K h - K o ^ I E K + G,,
(2)
^(K2-K20)=±hco(kll,kI)
(3)
K 0 , K sind die Wellenvektoren des primären und gestreuten Teilchens, hco die Energie des Phonons. Bei einem Oberflächenphonon gibt es zu jedem Wellenzahlvektor in der Oberfläche k„ eine Frequenz, für Volumen und gemischte Phononen dagegen ein Kontinuum. Die Gleichung ( 2 ) zeigt, daß bei reiner Oberflächenstreuung für jeden Streuwinkel zwischen einfallendem und reflektiertem Strahl eine Phononanregung möglich ist. Tragen zur Streuung nicht nur die Atome der obersten Schicht sondern auch noch einige Atomlagen darunter bei (langsame Elektronen), so gilt zusätzlich ein abgeschwächter Impulssatz für die Normalkomponente. Für die Anregung von Oberflächenphononen bedeutet dies eine Modulation der Intensität bei Änderung der Normalkomponenten des Impulsübertrages, für die Anregung von Volumenphononen dagegen eine Frequenzverschiebung. Theoretisch können Oberflächen- und Volumenphononen dadurch unterschieden werden. Eine solche Unterscheidung kann sogar ohne Energieanalyse allein aus der Winkelverteilung getroffen werden, wenn die Energie der Teilchen klein gegen die Phononenenergie ist, z. B. Streuung von He-Atomen aus einer 4 °K-Quelle. ( 2 S ) Doch sind entsprechende Experimente noch nicht bekannt. In der Handhabung bedeutend einfacher ist die inelastische Streuung langsamer Elektronen. Obgleich die Technik der Monochromatisierung seit langem bekannt ist (26> 27,28,29,30^ sind erst in letzter Zeit Versuche unternommen worden, diese Methode auf Oberflächen anzuwenden. Dies ist umso erstaunlicher, als die Methode der inelastischen Streuung langsamer Elektronen gegenüber den optischen Methoden große Vorteile hinsichtlich der Empfindlichkeit sowie der Möglichkeit, einen großen Spektralbereich gleichzeitig zu untersuchen, bietet. Als Nachteil muß die begrenzte energetische Auflösung von 10-50 meV je nach erforderlicher Intensität gewertet werden.
3. Quadratischer Mittelwert der Schwingungsamplitude von Oberflächenatomen 3.1. Möglichkeiten der Messung Oberflächenphononen sind z. Z. nur in Sonderfällen (vgl. 6 ) im Experiment beobachtbar und theoretisch zu berechnen. Das Interesse hat sich daher lange Zeit auf
140
eine Größe konzentriert, von der man glaubte, daß sie einer Messung leichter zugänglich wäre, nämlich das mittlere Amplitudenquadrat der Schwingung < uf > T von Oberflächenatomen. Bekanntlich bestimmt diese Größe die Temperaturabhängigkeit des elastischen Streuquerschnittes in Bornscher („kinematischer") Näherung. Für einatomige Kristalle und Volumenstreuung ist der différentielle Streuquerschnitt (siehe z. B. (s)) ^
= N».-«W|f„P28(«)8(S-G)
(4)
G
Dabei sind N die Zahl der Atome, f 0 der Atomfaktor S = K - K 0 der Streuvektor und W=^r
(5)
der sog. Debye-Waller Faktor. Er ist vom Phononenspektrum Z(gj) und über die mittlere Energie eines harmonischen Oszillators im thermischen Gleichgewicht e(co, T) von der Temperatur T abhängig.
Dabei ist M die Masse der Atome. Für genügend hohe Temperaturen T > © D ist W ~ T. Aus der Debyeschen Näherung für das Spektrum ist dem Debye-Waller Faktor bei hohen Temperaturen eine DebyeTemperatur © D zugeordnet U h i s L 2 M kg ©q Mißt man die elastisch reflektierte Intensität langsamer Elektronen als Funktion der Temperatur, so finden alle Autoren (31~37) übereinstimmend 1. eine experimentelle Abhängigkeit der Intensität von der Temperatur entsprechend Gleichungen (4) und (7); 2. eine Debye-Temperatur nahe dem Volumenwert für hohe Elektronenenergien (einige 100 eV) und generell eine Abnahme der gemessenen Debye-Temperatur mit sinkender Elektronenenergie. Da die Eindringtiefe der Elektronen mit sinkender Energie abnimmt, wurde diese Abnahme der gemessenen Debye-Temperatur mit einer Vergrößerung des mittleren Amplitudenquadrates der Schwingung von Oberflächenatomen gegenüber Volumenatomen erklärt. Das ist qualitativ plausibel, da Oberflächenatome wegen der einseitig fehlenden Partner schwächer gebunden sein sollten, wenigstens bei den bisher ausschließlich untersuchten Metallen. Es ist jedoch nicht möglich, aus den genannten 141
Messungen quantitative Werte für < u 2 > T von Oberflächenatomen zu gewinnen. Wegen des großen elastischen Streupotentials der Atome V f « 10 eV kann die Mehrfachstreuung langsamer Elektronen nicht vernachlässigt werden. Zwar ergibt sich auch unter Berücksichtigung der Mehrfachstreuung („dynamische") Theorie) eine exponentielle Abhängigkeit der Reflex-Intensität von der Temperatur, was den ex39 perimentellen Befund erklärt, jedoch konnten Duke und Laramore ) zeigen, 2 daß der Zusammenhang zwischen dem Exponenten und < u > T im dynamischen Fall unbekannte Parameter, wie die Phase der S-Streuung und die inelastische freie Weglänge enthält und auch noch vom gewählten Reflex abhängt. Dies ist nicht überraschend, da schon Horstmann (40) für schnelle Elektronen an AI-Schichten zeigen konnte, daß für dynamische (niedrig indizierte) Reflexe der Exponent der Temperaturabhängigkeit zwischen Null und 4 W schwanken kann. Man versuchte deshalb in der Streuung langsamer Elektronen nur Messungen in sog. kinematischen Reflexen zur Auswertung nach < u 2 > x heranzuziehen. Als kinematisch wurden dabei Reflexe bezeichnet, wenn bei fester Komponente des Streuvektors parallel zur Oberfläche ein Maximum der Intensität bei einer Elektronenenergie auftrat, die der Bragg-Bedingung (Gl. (4)) entsprach. Dieses Verfahren ist jedoch aus zwei Gründen unbefriedigend. Einmal ist zur Indizierung der kinematischen Reflexe eine sog. innere Potential-Korrektur von ca. 10-20 eV notwendig. In der Bandtheorie der Beugungsreflexe ist dies der nichtperiodische Anteil des Gitterpotentials, um den die Bandstruktur und damit auch die kinematisch indizierten Reflexe gegenüber dem Vakuumniveau verschoben werden müssen. Das innere Potential kann aber nicht unabhängig von der Elektronenenergie definiert werden. (41) Dadurch besteht namentlich bei den für den DebyeWaller Faktor besonders interessanten niedrigen Elektronenenergien eine Unsicherheit im Betrag von S und damit auch von < u 2 > T , die leicht 20 % erreichen kann. Zum zweiten ist die Zuordnung von Intensitätsmaxima zu kinematischen Reflexen nicht eindeutig. Bei Betrachtung experimenteller Intensitäts- über Energiekurven (33,42,43) fällt die unterschiedliche Breite der Intensitätsmaxima auf. Andererseits läßt sich unter sehr allgemeinen Voraussetzungen zeigen, daß die energetische Breite der Reflexionsmaxima gleich 2 V; sein sollte (41), wenn V; den Imaginärteil des Potentials darstellt, welcher den Einfluß der inelastischen incohärenten Streuung auf die elastische Intensität beschreibt. ( 44 ) Daraus folgt, daß scheinbar als kinematisch bezeichenbare Reflexe wie z. B. der (555) Reflex an (111) AI (33) und der (004) und (006) Reflex an (100)-Cu («) in Wirklichkeit aus einem Cluster gedämpfter Maxima verschiedenen Ursprungs bestehen^45) In sehr eindrucksvolle! Weise wurde kürzlich von Reid (46) an (100)Kupferflächen demonstriert, daß die Temperaturabhängigkeit von nahe benachbarten Reflexionsmaxima völlig verschieden sein kann (Fig. 1). Auch Tabor und Wilson (47) fanden an Cr und Mo bei annähernd gleicher Elektronenenergie stark verschiedene ©D-Werte, je nachdem, ob das untersuchte Intensitätsmaximum annähernd kinematischen oder dynamischen Ursprungs zu sein schien. 142
w c 0»
Fig. 1 Intensität des 00 Reflexes als Funktion der Elektronenenergie an (100) Kupfer-Flächen für verschiedene Temperaturen (nach Reid ( 4 6 )). Einfallswinkel 12°.
20
30 40 Energie
eV 50
Aus einer pauschalen Größe, wie sie das mittlere Amplitudenquadrat der Schwingung von Oberflächenatomen darstellt, können durch Vergleich mit theoretischen Rechnungen nur dann Schlüsse auf die Richtigkeit zugrunde liegender Modellvorstellungen gezogen werden, wenn die experimentellen Ergebnisse genügend genau sind. Nach dem bisher gesagten scheinen dafür nur geringe Aussichten zu bestehen. Dennoch ergeben zwei neuere Entwicklungen Anlaß zu berechtiger Hoffnung. Webb et al. ( 48 ) konnten an Ag zeigen, daß eine geeignete Mitteilung der gemessenen Intensitäten über den Azimutwinkel und den Streuwinkel bei festem Streuvektor S eine Abhängigkeit der Intensität von S erzeugt, welche gleich der kinematisch berechneten mit Absorption ist. Eine andere Mittelung mit ähnlichem Resultat wurde von Duke und Tucker ( 49 ) auf die theoretisch im „inelastic collision" Modell berechneten Intensitäten angewandt. Wenn diese Mittelungsprozeduren eine prinzipiell theoretische Begründung finden oder aber sich an einer größeren Zahl von Substanzen bestätigen lassen, ist auch zu erwarten, daß sich kinematische Debye-Waller-Faktoren damit ermitteln lassen. Ignatjevs, Pendry und Rhodin (50) 143
haben kürzlich erstmalig LEED-Bilder an einer reinen, kristallinen Fläche eines festen Edelgaskristalles (111) Xe gewonnen. Wegen des großen Atomvolumens ( so ) ist das Potential der elastischen Vorwärts- und Rückwärtsstreuung bei Edelgaskristallen klein gegen den Imaginärteil des Potentials. Deswegen kann die Mehrfachstreuung praktisch vernachlässigt werden, und die Intensität ist rein kinematisch. Trotzdem enthält die Intensität ausschließlich Information aus der Oberfläche, da der Imaginärteil des Potentials etwa 4 eV (s°) und damit die Extinktionslänge für die Intensität bei 100 eV etwa 5 Ä, also weniger als eine Gitterkonstante, beträgt. Damit lassen sich aus den Intensitäten im Prinzip sowohl die Gitterkonstante als auch das Amplitudenquadrat der Schwingung bestimmen. Ignatjevs et al. geben an, daß die von ihnen so gemessene Gitterkonstante 6,16 Ä bei 40 °K beträgt und damit praktisch mit der röntgeneographisch, also im Volumen gemessenen, übereinstimmt. Unglücklicherweise ist die theoretisch zu erwartende Aufweitung der Gitterkonstanten in der Oberfläche ausgerechnet für die (111) Fläche bei 40 °K besonders klein, nämlich nur etwa 1 % (Fig. 2 und Fig. 3 in (12)). Möglicherweise reichte daher die bisherige Genauigkeit der Temperaturmessung nicht aus, um den geringen Unterschied zu entdecken. Auf jeden Fall scheinen die Messungen an Edelgaskristallen sehr aussichtsreich zu sein, nicht zuletzt auch deshalb, weil gerade für Edelgaskristalle begründbare theoretische Modelle existieren. 3.2. Theoretische Berechnungen Eine Möglichkeit, mittlere Amplitudenquadrate in harmonischer Näherung zu berechnen, bieten Modelle mit vorgegebenen Kraftkonstanten zwischen den Atomen. Während in einer Reihe älterer Arbeiten an unrealistischen Modellen (lineare Kette, einfach kubische Gitter) (5I> 52>s3) lediglich theoretische Methoden demonstriert wurden, ist später auch ein Vergleich mit experimentellen Werten versucht worden. Zusammenfassende Artikel bis 1966 bzw. 1967 wurden von Maradudin ( 54 ) und Ludwig ( s ) geschrieben. Umfangreiche Rechnungen wurden vor allem von Clark, Hermán und Wallis (S5> 56,57) fú r fcc Kristalle und nächste Nachbar Zentralkräfte durchgeführt. Die Kraftkonstanten wurden aus den elastischen Daten berechnet und bis zur Oberfläche als ungeändert angenommen. Es ergaben sich z. B. für die (110) Fläche die Werte in Tabelle 1. Tabelle 1: Theoretische und „experimentelle" Werte oberfläche / ^ u 2 - > Volumen an (110) Ni Richtung
[110] s6
theoretisch ( ) experimentell ( 3 2 )
1,4 1,58
[001]
[110]
2,15 3,14
2,0 3,14
Interessant ist zunächst, daß trotz ungeänderter Kräfte alleine die niedrigere Symmetrie in der Oberfläche zu verschiedenen Werten für die einzelnen Richtungen führt. Auch für eine (100) Fläche ist die normale Auslenkung größer als die aus 144
Symmetriegründen einander gleichen tangentialen. Aus der Annahme von Zentralkräften allein folgt für den Modellkristall die Gültigkeit der Cauchy-Relationen zwischen den elastischen Konstanten ( 58 ); also C12 = C 4 4 . Diese Relation ist für fast alle kubischen Kristalle nicht einmal näherungsweise erfüllt. Das schränkt die Vergleichsmöglichkeiten mit experimentellen Daten stark ein. Eine Ausnahme bildet lediglich das Nickel (C 12 /C 44 =1,17), bei dem auch die Phonondispersionskurven im Zentralkraftmodell mit nächsten Nachbarn erstaunlich gut beschrieben werden. ( 56 ) Will man den „experimentellen" Werten für Nickel (Tabelle I) glauben, dann sind die berechneten Werte für die [110] und [001] Richtung zu klein. Deshalb haben Wallis et al. systematisch die Änderung der Werte für < u 2 > 0 b e r f i ä c h e mit einer Änderung der Kraftkonstanten in der Oberfläche zu den verschiedenen - in der Oberfläche nicht gleichwertigen - nächsten Nachbarn untersucht. Eine Anpassung an die „experimentellen" Werte wurde dadurch möglich, ohne daß sich daraus etwas für die Richtigkeit des Modells folgern ließe. Etwas befriedigender in dieser Hinsicht sind Rechnungen, die von einem interatomaren Potential ausgehen. Vail ( 59 ) fand für einfach kubisches Gitter mit MorsePotential eine Abnahme der nächsten Nachbar-Kraftkonstanten für Atombewegung senkrecht zur Oberfläche von 40 %. Doch sind auch solche Rechnungen für Metalle nur begrenzt anwendbar, da wegen der geänderten Elektronendichte in der Oberfläche auch der Bindungszustand und damit das Potential geändert sein müssen. ( 60 ) Am besten läßt sich die Annahme eines Zweikörper-Zentralkraft-Potentials für Edelgaskristalle begründen. (58>61) Dynamische Oberflächeneigenschaften von dünnen Schichten von Edelgaskristallen wurden deshalb von Allen und Wette in einer Reihe von Arbeiten (62> 12>63. 64> 6,65) unter Verwendung eines 6—12 Lennard-JonesPotential berechnet. Bei Zugrundelegung eines Potentials lassen sich thermische Mittelwerte durch Simulierung der Gitterbewegung im Computer bilden ohne die Bewegungsgleichung numerisch oder gar analytisch lösen zu müssen (molekulardynamische Methode). Der große Vorteil Uegt darin, daß alle anharmonischen Effekte wie Einstellung neuer statischer Gleichgewichtslagen in der Oberfläche, thermische Ausdehnung im Volumen und in der Oberfläche, und schließlich Änderung der Kraftkonstanten durch Temperatur bzw. die Bewegung der Atome voll berücksichtigt werden. Die Autoren konnten auf diese Weise zeigen ( 12 ), daß z. B. die dynamische Verschiebung der Gleichgewichtslage in der Oberfläche bei der halben Schmelztemperatur etwa doppelt so groß ist wie die statische ist, welche sich einfach aus der Minimalisierung der potentiellen Energie errechnet. Ferner zeigte sich, daß die quadratischen Mittelwerte der Amplituden völlig verschieden von denen aus einem Kraftkonstantenmodell sind (Tabelle II bzw. Tabelle III aus ( 64 )). Aus dem Vergleich von Tabelle 2 und den „experimentellen" Werten von Tabelle 1 sieht man, daß die molekular dynamische Methode die Anisotropie ohne Zusatzannahmen recht gut wiedergibt. Auch die Tendenz zu höheren Werten ist in qualitativer Übereinstimmung mit den „experimentellen" Daten. Der starke anharmonische Einfluß auf normalerweise harmonische Größen an der Oberfläche läßt sich qualitativ leicht verstehen. Betrachtet man z. B. die Bewegung 10 Festkörperprobleme X I
145
Tabelle 2: Verhältnisse von oberfläche / < u 2 > v o l u m e n n a c h ( 6 4 ) für fcc Gitter. SFC: Kraftkonstanten Modell mit Zentralkräften zu allen Nachbarn. MD, \ Tm : molekular dynamisch bei halber Schmelztemperatur. Exp.: Experimentelle Werte nach ( 3 2 ) Nick (35) a) Palladium, b) Blei; (3 4 ) Platin; (6?) Kupfer; ( 6 8 ) a) Eisen, b) Blei; ( 3 3 ) Silber und ( 6 6 ) Kupfer
Oberfläche (100)
Komponente
SFC
MD, \ T M
=
1,46 1,87
2,23 ±0,17 3,07 +0,15
2 , 8 6 3 S a ; 3 , 9 2 3 4 ; 2,13 67 > l , 7 4 6 8 a
p eine Lösung von (28) wenn 77, f die Hauptachsen des Kristalls angeben. ( 87 ) Für Kristallflächen, die von Hauptachsen aufgespannt werden, sind die Lösungen wieder von der Form (24) wobei jedoch K im Innern von k verschieden ist und, wenn die Hauptachse in der Oberfläche liegt, von der Ausbreitungsrichtung des Oberflächenphonons abhängt. Die Frequenz des Oberflächenphonons ist durch die Bedingung (29) gegeben, wobei e„ (co) die Dielektrizitätskonstante normal zur Fläche also entweder gleich ej oder gleich ej- ist. 5.2. Wechselwirkung mit dem Lichtfeld Für die Beschreibung der Wechselwirkung von Oberflächenphononen mit dem Lichtfeld muß in den Gleichungen (18), (19) die Retardierung berücksichtigt werden. Die Lösungen sind dann i. a. komplizierter und wurden fiir die Geometrie einer 155
£(ü))
k
*C
0)TO
Fig. 7. Lage der Oberflächenphononen für einen halbunendlichen Kristall. Die quantitativen Verhältnisse entsprechen denen von ZnO (liOO). Für die Erläuterung der verschiedenen Gebiete siehe Text.
Schicht von Fuchs und Kliewer ( 84 ) bzw. für Schicht, Kugel und Zylinder von Englman und Ruppin ( s r ) ausführlich diskutiert. Verhältnismäßig übersichtlich und teilweise qualitativ verständlich sind die Verhältnisse wieder für den halbunendlichen Kristall als Grenzfall einer Schichtgeometrie. Die Lösungen haben dann parallel zur Grenzfläche eine Ortsabhängigkeit ~ e lk * x . Senkrecht zur Oberfläche entspricht die Ortsabhängigkeit einer Superposition einlaufender, auslaufender und reflektierter Wellen oder einer exponentiell abklingenden Amplitude. Die Randbedingungen sind dabei so festgelegt, daß im Vakuum im Unendlichen nur eine auslaufende Welle existiert. Den verschiedenen Bereichen eines co über k x Diagramms (Fig. 7) lassen sich jeweils verschiedene Gruppen von Lösungen zuordnen. Lösungen mit reeller z-Komponente des k-Vektors im Vakuum, also strahlende Lösungen existieren nur links der Geraden a> = k x c, also wenn k x < k = ^ ist. In den Gebieten Rj und R't in Fig. 7 entsprechen die Lösungen einer von innen einlaufenden und reflektierten, sowie einer ins Vakuum transmittierten Welle. Im Gebiet R 2 ist e(co) negativ, daher kann im Innern nur eine exponentiell zur Grenzfläche hin ansteigende Amplitude existieren, die sich dann als laufende Welle im Vakuum fortsetzt. Die bisher beschriebenen Schwingungen wurden von Ricks und Kliewer als virtuell bezeichnet, da sie im thermischen Gleichgewicht nicht angeregt sind. Trotzdem lassen sich die Reso156
nanzen in der optischen Absorption nach diesen virtuellen Polaritonmoden klassifizieren. ( 8S ) Die Lösungen in den Gebieten L j und L¡ entsprechen einer von innen einlaufenden und reflektierten Welle und einer exponentiell abklingenden Amplitude im Vakuum, also einer Totalreflexion von innen. Mit wachsendem Wert von k x wird bei fester Frequenz co der Einfallswinkel immer größer. Die Grenzkurven kx = k = beschreiben den streifenden Einfall. Jenseits dieser Grenzkurven in dem Gebiet N existieren keine Lösungen. Oberflächenphononen mit exponentiell abklingender Amplitude nach beiden Seiten der Grenzfläche existieren in dem Gebiet L 2 . Ihre Frequenz ist durch die Kurve (30) gegeben. Für k x > ^ führt diese Relation auf die schon bekannte Bedingung e(u>) = - 1. Da die Oberflächenphononen rechts der Geraden co = k x c liegen, wechselwirken sie nicht mit dem Lichtfeld, sind also auch in einem Absorptionsexperiment nicht beobachtbar (vgl. aber (91> 92 )). Dies gilt auch für den Fall einer ebenen Platte, wo die Oberflächenphononen Kopplungsdispersion zeigen. Absorption und Reflexion von infrarotem Licht an einer dünnen Platte sind durch die Anregung von Polaritonen im Gebiet der strahlenden virtuellen Lösungen bestimmt. Bei einer Plattendicke von a = \ T zeigen die von Fuchs und Kliewer berechneten Absorption- und Reflexionskoeffizienten eine Serie von Maxima und Minima auf beiden Seiten der Reststrahlbande, die wie bei einem Perot-Fabry-Interferometer einer Vielstrahlinterferenz zwischen an Vorder- und Rückseite reflektierten Wellen entsprechen. Diese von Fuchs und Kliewer berechneten Resonanzen sind jedoch wahrscheinlich experimentell nicht beobachtbar, da durch die in der Rechnung nicht berücksichtigte Absorption durch Multiphononprozesse mit einer Absorptionskonstanten von einigen hundert cm - 1 die einfallende Welle bereits bei einem einmaligen Durchgang durch die Platte um einen nennenswerten Bruchteil geschwächt wird und sich deshalb keine Vielstrahlinterferenz ausbilden kann. In der Absorption an Platten die wesentlich dünner sind als eine Wellenlänge wird bei schiefem Einfall nur die Anregung der niedrigst indizierten Polaritonen beobachtet, deren Frequenz mit denen der longitudinalen und transversalen Volumenphononen praktisch übereinstimmt (Betremann Effekt. ( 93 )) Die Tatsache, daß sich die Oberflächenphononen nicht in der optischen Absorption bemerkbar machen, ist eine Spezialität der Plattengeometrie. In allen anderen Fällen zeigen die berechneten Absorptionsspektren Maxima durch Anregung von Oberflächenphononen im Gebiet zwischen coT und coL. Solche Absorptionen wurden z. B. von Hass ( 9 4 ) an auf ein 1,7 /U Stufengitter aufgedampften NaCl und LiF Schichten beobachtet. Pastmak und Hejda untersuchten die Absorption von A1N an kleinen einkristallinen und mikrokristallinen Proben. (95> Sie konnten den Oberflächencharakter dreier Maxima an mikrokristallinen Proben durch die Frequenz157
Fig. 8. Transmissionsspektren von KCl Parallelepipeden nach Martin ( 9 7 ) bei 7 °K gestrichelte Kurve: mittlere Kristallgröße 9 X 9 X 2,5 ju. 65 % Bedeckung, voll ausgezogene Kurve: mittlere Kristallgröße 4,5 X 4,5 X 2 p, 85 % Bedeckung.
Verschiebung bei Einbettung in verschiedene Dielektrika nachweisen (vgl. Gl. (25)). Sie demonstrierten ferner die Zunahme der Absorption durch Oberflächenphononen mit abnehmender Korngröße. Die starke Abhängigkeit experimentell beobachteter Absorptionsspektren von der Kristallitgröße zeigen die Messungen von Martin (97) an kleinen KCl Platten (Fig. 8). Da geringfügige Änderungen der Kristallgröße und Form große Änderungen in den Absorptionsspektren hervorrufen, können Messungen an Pulvern mit unbekannter Größenverteilung und Form der Kristallite i. a. nur schwer interpretiert werden. Trotzdem gelang Englman und Ruppin in einer Reihe von Fällen der Nachweis, daß Absorptionsmaxima, die früher fälschlich der Anregung von Volumenphononen zugeschrieben wurden, in Wirklichkeit durch Oberflächenphononen hervorgerufen wurden. (87)
5.3. Energieveriuste von Elektronen Wie gezeigt wurde, sind longitudinal optische Volumenphononen und Oberflächenphononen von langwelligen elektrischen Feldern begleitet. Es ist daher eine intensive Wechselwirkung mit Elektronen zu erwarten. Energieverluste schneller Elektronen durch Anregung von Phononen wurden zuerst von Boersch, Geiger und Stichel (98) bei der Durchstrahlung dünner LiF Schichten mit 25 KeV Elektronen nachgewiesen (Fig. 9). 158
Fig. 9. Energieverluste mittelschneller Elektronen (25 KeV) bei Durchstrahlung dünner LiF Schichten nach Boersch et al. ( 9 8 ).
Eine Deutung der Energieverlustspektren ist auch im Rahmen der klassischen Elektrodynamik möglich. Dabei wird der Festkörper als Dielektrikum mit einer Dielektrizitätskonstante e(o>) = ei + i e 2 betrachtet und der Energieverlust des Elektrons aus der Dämpfung des von ihm im Dielektrikum erzeugten Feldes berechnet. Der Energieverlust einer elektromagnetischen Welle ist ~ e2, das Feld des Elektrons ist im Volumen um den Faktor 1 /1 e I abgeschirmt. Damit wird der Energieverlust im Volumen proportional ej + e!
=-Im
e(w)
(31)
Der Energieverlust hat ein Maximum bei eL = 0, entspricht also der Anregung eines longitudinalen Volumenphonons. Diese anschauliche Interpretation der Energieverlustformel wurde von H. Raether ( 98 ) gegeben. Multiphononverluste treten in der klassischen Theorie nicht auf. In der Nähe einer Grenzfläche des Dielektrikums ist der Abschirmfaktor geändert. Befindet sich das Elektron auf der Vakuumseite einer ebenen Grenzfläche zu einem halbunendlichen Dielektrikum, so ist der Abschirmfaktor l / l e + iL Der Energieverlust W
z = — Im ——: ( e i + l ) 2 + e! e +1
(32)
159
hat eine Resonanz nur bei ej = - 1. Dies entspricht der Vorstellung, daß das Elektron außerhalb des Dielektrikums nur mit Oberflächenphononen wechselwirkt, denn das Feld des longitudinalen Volumenphonons dringt nicht ins Vakuum ein. Bei der Durchstrahlung dünner Schichten, wie in den Experimenten von Boersch et al. treten Oberflächen- und Volumenverlust gleichzeitig auf. Zusätzlich muß außerdem die schon erwähnte Kopplungsdispersion der Oberflächenphononen berücksichtigt werden. Eine zusammenfassende Darstellung der klassischen Aspekte der dielektrischen Theorie wurde von Geiger ( 10 °) gegeben. Da bei der Herleitung kein Bezug auf eine spezielle Anregung des Festkörpers genommen wurde, gelten die Gleichungen (31) und (32) auch für die Wechselwirkung mit Plasmonen. Die inelastische Streuung von schnellen Elektronen an Feldern von Oberflächenund Volumenphononen kann auch quantenmechanisch in Bornscher Näherung berechnet werden. Dieser Weg wurde von Stern und Ferrell ( " ) für Streuung an Oberflächenplasmonen beschritten. Für die Bestimmung der Größe der Feldamplitude muß dann die gesamte elektrostatische Energie U nachträglich der Quantenbedingung U = nhco s unterworfen werden. Im Falle der Streuung an Oberflächenphononen ist zusätzlich noch die mechanische potentielle Gitterenergie zu berücksichtigen, wodurch sich die Streuwahrscheinlichkeiten für Phononen und Plasmonen etwas unterscheiden. Die Ergebnisse aus der Bornschen Streuung und der klassischen Theorie sind gleich.
Die Einführung einer nachträglichen Quantenbedingung wird vermieden, wenn man von vornherein den Hamiltonoperator für das Elektron und Phononen- bzw. Polarisationsfeld aufstellt. Im Falle der Volumenphononen ist das praktisch der Fröhlich'sehe Hamiltonoperator für große Polaronen. ( 102 ) Das gestreute Elektron wird durch die Wechselwirkung mit Phononen nur wenig beeinflußt, solange seine Energie groß gegen hco ist. Dadurch ist das Problem entkoppelt, und das Elektron stellt, vom Phonon aus betrachtet, eine fest vorgegebene lineare Störung dar. Die Anregungswahrscheinlichkeiten für Ein- und Mehrphononenanregungen können dann für behebige Elektronenbahnen berechnet werden. Diese Betrachtungsweise wurde kürzlich von Lucas, Kartheuser, Badro und Sunjic (104-106) ausführlich diskutiert. Für den im folgenden besonders interessierenden Fall der Reflexion von Elektronen an einem halbunendlichen Kristall (Eindringtiefe Null) finden die Autoren für das Verlustspektrum
(33) mit 2
4 7T h 2 w s 160
kv ± + i ( « , - k v | )
++
kv;-i(wg-kv¡¡)
(34)
Dabei ist u>p = 4 co j bei Wechselwirkung mit Phononen. Bei Wechselwirkung mit Plasmonen ist to p die Volumenplasmafrequenz, v = (v„, vx) und Y.' = (v'i , vi) stellen die Geschwindigkeitskomponenten parallel und senkrecht zur Oberfläche für das einlaufende und auslaufende Elektron dar. Die Gleichungen beschreiben also auch das Verlustspektrum in einem Beugungsreflex. Wie man aus der Entwicklung von Gl. (33) sieht, stellt Q(k) die Anregungswahrscheinlichkeit für ein Oberflächenphonon der Frequenz cos und der Wellenzahl k dar. Q(k) hat ein resonanzartiges Maximum, wenn die Komponente der Elektronengeschwindigkeit in Laufrichtung der Oberflächenwelle gleich der Phasengeschwindigkeit ist. Die Dämpfung der Resonanz ist umso geringer, je größer die Wechselwirkungszeit T = 7~~ ist. kvx Der Resonanznenner in Gl. (34) sorgt dafür, daß vorzugsweise langwellige Phononen angeregt werden. Bei einer Elektronenenergie von E 0 = 10 eV, einem Einfallswinkel von 45° und einer Phononenenergie von 70 meV beispielsweise tritt Resonanz mit einem Oberflächenphonon der Wellenzahl k = 5,5 • 10~3 Ä"1 ein. Die inelastische Intensität ist daher in einem Kegel vom Öffnungswinkel d » i?E = um den elastisch reflektierenden Strahl zu finden. Trotzdem kann die Retardierung vernach( J T lässigt werden, da k immer noch groß gegen — ist (siehe Fig. 7). Bei einer Richtung der Elektronenbahn genau parallel zur Oberfläche, divergiert die Streuwahrscheinlichkeit für jede Geschwindigkeit des Elektrons. Das Elektron kann dann nicht mehr als unabhängig von der Potentialwelle betrachtet werden. Das Phänomen ist vergleichbar mit der Wechselwirkung drn tender Elektronen mit Phononen in piezoelektrischen Substanzen. Der Gültigkeitsbereich der Formel (34) ist für die Wechselwirkung mit Plasmonen auf Elektronenenergien E 0 oberhalb von etwa 1 kV beschränkt. Unterhalb dieser Energie muß berücksichtigt werden, daß sich die Wellenlänge des Elektrons nach der inelastischen Streuung geändert hat und daher auch die Bragg Reflexe bei einer höheren Energie auftreten. ( 107 ) Darüber hinaus treten inelastische Streumaxima der aus der inelastisch und elastisch gestreuten Welle gebildeten Seitenbanden auf.( 108 ) Da in die Streuwahrscheinlichkeit nach Gl. (34) der Absolutwert der Elektronengeschwindigkeit eingeht, ist starke inelastische Streuung an Plasmonen nur bei streifendem Einfall, starke inelastische Streuung an Phononen dagegen auch bei nahezu senkrechtem Einfall möglich.
6. Anregung optischer Oberflächenphononen durch langsame Elektronen 6.1. Elektronenspektrometer Zur Untersuchung der inelastischen Streuung langsamer Elektronen an Oberflächenphononen müssen Energieverlustspektrum und Winkelverteilung der gestreuten Elektronen gemessen werden. Die Quantenenergien optischer Phononen liegen im Be11 Festkörperprobleme X I
161
reich von 20—80 meV. Da die Halbwertsbreite aus einer Kathode thermisch emittierter Elektronen bei ca. 300 meV liegt, ist eine Monochromatisierung erforderlich. Für langsame Elektronen haben sich elektrostatische Ablenksysteme, insbesondere Zylinder- und Kugelkondensator, als zweckmäßig erwiesen. Die fokussierenden Eigenschaften dieser Systeme bei gleichzeitiger Energieselektion wurden zuerst von Hughes, Rojanski und McMillen ( 2 6 ) theoretisch und experimentell untersucht. Für den idealen Zylinder- bzw. Kugelkondensator ergibt sich Winkelfokussierung erster Ordnung bei einem Ablenkwinkel von 127° bzw. 180°. Randfeldkorrekturen ( 1 0 9 ) und die Verwendung größerer Aperturen ( 1 0 8 ) verschieben den optimalen Ablenkwinkel zu kleineren Werten. Eine umfassende Berechnung der Abbildungseigenschaften elektrostatischer Systeme wurde von WoUnik ( m ) durchgeführt. Die Energieselektion ohne Berücksichtigung der Bildfehler ist danach gegeben durch AEX/2 _ s' + s"
Em
~ 4r0
P2
(35)
Dabei ist AE t / 2 die energetische Halbwertsbreite der transmittierten Intensität, E m die Energie der Elektronen im Monochromator; s', s" die Breite der Eintrittsbzw. Austrittsblenden, r 0 der Bahnradius und p = \fl für den Zylinder bzw. p = 1 für den Kugelkondensator. Zur Erzielung einer hohen Auflösung ist es notwendig, die Elektronen möglichst langsam durch den Monochromator laufen zu lassen. Der maximale monochromatische Strom ist dann durch die Raumladung begrenzt. J = c, E t f AE 1 / 2 = C l
(AE i / 2 )S»
(36)
An Hand dieser Formel läßt sich überlegen, auf welche Weise der maximale Strom bei vorgegebener Auflösung erzielt werden kann. Einer Vergrößerung des Bahnradius sind Grenzen gesetzt, da die erforderlichen Ablenkspannungen immer kleiner werden und restliche Magnetfelder die Abbildung stören. Darüber hinaus ist eine Verkleinerung der Ablenkspannungen unter einige hundert mV problematisch, da örtliche Inhomogenitäten in den Austrittsarbeiten der Ablenkplatten schwer zu vermeiden sind. Eine Verkleinerung der Spaltbreiten s' und s" unter einer gewissen Grenze fuhrt zu einer Verringerung des Stromes, da ein immer kleinerer Bruchteil des von der Kathode emittierten Stromes in den Monochromator gelangt. Bei dem Versuch, maximalen Strom bei gegebener Auflösung zu erzielen, haben Kuyatt und Simpson ( 2 9 ) bisher den größten Erfolg gehabt. Das wesentliche Konstruktionsmerkmal ihres Spektrometers mit Kugelkondensatoren ist die Ersetzung der Monochromatorspalte durch Bilder von auf höherem Potential liegenden Spalten. Bei 50 meV Halbwertsbreite werden ungefähr 10~7 A Strom erreicht. Als gewisser Nachteil dieses Systems muß seine Größe und Komplexität (ca. 50 Elektroden) betrachtet werden. 162
Einfacher ist das Spektrometer von Ehrhardt et al. (30) auf der Basis von Zylinderkondensatoren. Bei Verwendung von 0,5 mm breiten Monochromatorspalten wurden einige 10~8 A Strom bei 50 meV Auflösung erzielt. Alle bisher beschriebenen Spektrometer wurden für die inelastische Streuung von Elektronen an Atomstrahlen entwickelt (Ausnahme siehe 4.2). 6.2. Experimentelles zur Streuung an Oberflächenphononen Für die Untersuchung von Festkörperoberflächen durch inelastische Streuung langsamer Elektronen wurden zwei Spektrometer (im folgenden Typ I und Typ II genannt) konstruiert. Einzelheiten der Konstruktion sind bei Ehrhardt et al. (29) veröffentlicht !). Es wird deshalb nur auf Modifikationen eingegangen. Das Spektrometer Typ I ist in Fig. 10 dargestellt. Zur Erzielung einer höheren Auflösung sind die Spaltbreiten der Monochromatoren auf 0,3 mm reduziert. Die Blenden bestehen aus vergoldetem antimagnetischem Edelstahl. Der Streuwinkel zwischen einfallendem und gestreutem Elektronenstrahl beträgt geometrisch 90°. Bei Experimenten stellte sich heraus, daß der tatsächliche Streuwinkel vermutlich durch geometrische Ungenauigkeiten oder restliche Magnetfelder im Kathodenraum größer und nicht genau kontrolliert war. Der Kristall kann um definierte Winkel gedreht sowie lateral und vertikal verschoben werden. Das System ist durch 4 mm starkes Mu-Metall magnetisch abgeschirmt. Die erzielte Auflösung, gemessen als Halbwertsbreite eines am Festkörper elastisch reflektierten Strahles, betrug ca. 20 meV. Die Verwendung von Netzen anstelle von Ablenkplatten wurde zuerst von Marmet und Kervin ( 27 ) vorgeschlagen. Ihre Verwendung hat in Monochromator und Analysator verschiedene Bedeutung: Im Monochromator sollen sie den Beitrag von Elektronen mit falscher Energie zur Raumladung vermindern. Allerdings können sie die Analysator
Monochromator
Kathode ElektronenVervielfacher
Kristall
Fig. 10 Elektronen spektrometer mit festem Streuwinkel. Einzelheiten siehe Text.
1cm
' ) Der Autor ist Prof. Ehrhardt für die Erläuterung konstruktiver Einzelheiten zu großem Dank verpflichtet.
163
Bildung einer Raumladung an der kritischen Stelle, dem Austrittsspalt, kaum verhindern, da in jedem Falle der überwiegende Teil der Elektronen an der Austrittsblende reflektiert wird. Im Analysator sollen die Netze verhindern, daß bei der Aufnahme eines Energieverlustspektrums der elastisch am Kristall reflektierende Strahl durch Reflexion an den Ablenkplatten einen Untergrund von Sekundärelektronen erzeugt. Dies ist dann von Bedeutung, wenn relative Intensität der Energieverluste mehrere Größenordnungen unter der elastisch reflektierten liegt. Beim Spektrometer Typ II sind die Netze durch gesandstrahlte Edelstahlflächen ersetzt. Die Spalten sind aus 0,2 mm starkem Platinblech gefertigt. Die Spaltbreite beträgt ungefähr 0,15 mm. Auf eine Vergoldung der Blenden wurde verzichtet. Die Kathode wird im Pulsbetrieb geheizt. Die Messung erfolgt in den Strompausen. Die Restmagnetfelder auf der Elektronenbahn sind kleiner als 10 mG, die örtlichen Variationen kleiner als 1 mG/cm. Die maximal erzielte Auflösung beträgt 8 meV. Der Strom beträgt bei 50meV Auflösung ungefähr 1,5-10~8 A. Durch Untersuchung der Beugungsreflexe eines Kristalles wurde sichergestellt, daß der Streuwinkel für alle Primärenergien 90° ±1° beträgt.
6.3. Ergebnisse an Zinkoxid Zinkoxid kristallisiert im Wurtzitgitter (Fig. 11). Der e-Tensor hat zwei verschiedene Komponenten für die Feldrichtung parallel zur polaren c-Achse und senkrecht dazu. Entsprechend gibt es zwei verschiedene infrarotaktive Eigenfrequenzen. Die Anisotropie beträgt jedoch nur einige Prozent (vgl. Tabelle 3). Für die Anregung optischer Oberflächenphononen durch langsame Elektronen in Reflexion ist ZnO besonders geeignet, weil die Reststrahlfrequenzen verhältnismäßig hoch liegen. Gegenüber den Alkalihalogeniden ist die Elektronenleitfähigkeit von Vorteil, die es erlaubt, Verlustspektren auch bei tiefen Temperaturen aufzunehmen. Die verwendeten Zinkoxidkristalle stammen aus dem 2. Physikalischen Institut der Technischen Hochschule Aachen. Die Oberflächen wurden bei den meisten Versuchen durch Spalten an Luft und Erhitzen im Ultra-Hochvakuum von 2 • 10"10 Torr präpariert. Die Ergebnisse wurden jedoch an im Ultrahochvakuum gespaltenen Flächen kontrolliert. Fig. 12 zeigt ein Energieverlustspektrum an einer (1100) Fläche in Spiegelreflexion ((00)Reflex). Im Vergleich zu der Anregung von Phononen oder Plasmonen mit schnellen Elektronen ist die Intensität der Ein- und Mehrphononenanregung sehr hoch. Der Abstand zwischen den Linien entspricht innerhalb der Meßgenauigkeit der Energie eines Oberflächenphonons (Tabelle 3) berechnet nach der Bedingung Re € „ ( « ) = - 1 e n (GJ) ist die Komponente des dielektrischen Tensors normal zur Oberfläche. Wegen der Anisotropie des Tensors ergibt sich für die polaren Flächen senkrecht zur c-Achse eine etwas kleinere Frequenz (Tabelle). 164
Tabelle 3: Gemessene und berechnete Frequenzen der Oberflächenphononen an ZinkoxidEinkristallen Oberfläche
Kxp.
(llOO) (0001) (0001)
68,8 ± 0,5
69,0
50,3
73,1
meV
67,5 ±0,5
67,3
46,8
71,5
meV
hu; L
Ker.
Zn
« in •C | e m n |. Auf Grund dieser „Niveauabstoßung" verschwindet die Gleichstromleitfähigkeit immer noch. Nimmt man der Einfachheit halber an em n —e oe nc e mn/'o
(8)
e
7
so läßt sich (6) auswerten und liefert ( )
(9) In höheren Näherungen muß man nicht nur Paare sondern Tripel usw. von Zentren berücksichtigen. Es ist klar, daß sich dadurch an der Tatsache, daßCT(0)= 0 ist, nichts ändert. Es liegt daher nahe, zu spekulieren, daß die Gleichstromleitfähigkeit verschwindet, solange nur e < E c ist. Dies führt dann zu dem CFMO-Modell ( 8 ) mit „Beweglichkeitskanten" E c und Ey für Leitungs- und Valenzband und einer entsprechenden Beweglichkeitslücke E c - Ey, welche im allgemeinen größer ist als die entsprechende optische Lücke, die nach (5) zu erwarten ist. Bei einem Vergleich der Energielücke aus optischen und elektrischen Messungen muß man also neben der Temperaturabhängigkeit auch diesen zusätzlichen Unterschied beachten, sowie schließlich die Tatsache, daß in amorphen Halbleitern die Fermikante nicht mehr genau in der Mitte zwischen Valenz- und Leitungsband liegen muß ( 9 ). Besonders verwickelt sind die Leitungsverhältnisse für €f E c . Man stellt sich vor, daß dann die Elektronen gerade durch einige wenige Potentialkanäle „percolieren" können (Fig. 6). Es ist noch unklar, in welcher Weise dabei die Beweglichkeit bei E c von ihrem Wert Null (unterhalb) auf ihren endlichen Wert (oberhalb) ansteigt. Der Prozeß des 'Photon-induzierten hopping', der zu einer Leitfähigkeit wie etwa (9) führt, wird bei endlichen Temperaturen normalerweise völlig überdeckt durch den des 'Phonon-induzierten hopping'. Die Theorie des phonon induced hopping wurde ursprünglich zur Erklärung der elektrischen Leitung in impurity-Bändern von stark dotierten Halbleitern entwickelt und von Davis und Mott ( 1 0 ) auf amorphe Halbleiter übertragen. Bei endlichen Temperaturen kann man normalerweise die Niveauabstoßung (7a) vernachlässigen, dagegen muß man die Niveauverbreiterung durch Phononenstöße berücksichtigen. Dies bedeutet (grob gesprochen), daß man ersetzen muß I v m „ | 2 6 (V m - V n - a>)~>(xm - xnfco2
^ T ;
(10)
Nimmt man für eine Abschätzung wiederum an 7mn = To e " r m n / r °
OD
so ergibt sich (12) 181
Fig. 6 A
A
®
A A
c E » E,
Schnitte durch das Potentialgebirge einer amorphen Substanz bei verschiedenen Energien (schematisch)
A
Wie man sieht, ist (9) gegenüber (12) zu vernachlässigen, solange co
T ist.
(12) kann im Prinzip benutzt werden zu einer Bestimmung der Termdichte N(e f ) an der Fermikante. Derart vorgenommene Bestimmungen weichen z.Z. jedoch noch um einige Zehnerpotenzen nach oben von denen ab, welche man aus optischen Messungen erwarten würde. Dies mag einerseits an experimentellen Unsicherheiten der elektrischen Messungen liegen, bei verschiedener Wahl der Kontakte ergeben sich z.Z. noch große Unterschiede in den Leitfähigkeiten (Fig. 7 und Fig. 8), andererseits an Unsicherheiten in der richtigen Deutung der optischen Daten. Z.B. ergeben sich wesentliche Unterschiede in der optischen Absorption, je nachdem die Fluktuationen der Bandkanten durch Dichteschwankungen über ein Deformationspotential oder durch Ladungsschwankungen entstehen (Fig. 9) ( 9 ). (12) liefert immer noch eine verschwindende Gleichstromleitfähigkeit. Dies liegt jedoch daran, daß bei der Herleitung von (12) nur hopping-Prozesse zwischen Paaren von Zentren berücksichtigt worden sind. Eine allgemeinere Behandlung kann ausgehend von einer kinetischen Gleichung ( 1 3 ) gegeben werden. (10) ist dann durch den allgemeineren Ausdruck ( 1 4 ) (13) 182
log (hv) -12
-10
-8
-6
(eV)
- ¿ - 2
0
2
• i i i i i i i i i i i i i i i i
6
2 - Q-As 2 Se 3 o Owen & Robertson * Ivkin and Kolomiets - Taylor, Bishop & Mitchell
0 -2
y•
-U -6
y
-8 -10
\ \
2
i
0 log (na) -
i/
-
•
2
U
6
(cm"1)
-
i
kT(300K) • i i i 0
_2
8
10
log (frequency)
12
U
-6
-8
16
(Hz)
Fig. 7. Frequenzabhängigkeit der elektrischen Leitfähigkeit von amorphem As2Se 3 nach Owen, Robertson, Jvkin, Kolomiets und Taylor, (s. Zit. ( 9 ) )
10"'
10- 2
10-3
10-4
102
103
104
105
106
107
108
Fig. 8. Verlustfaktor tgfi in Abhängigkeit von der Frequenz bei amorphem As2Se 3 nach Creveceour und de Wit (12)
zu ersetzen. Dabei ist T der Stoßoperator der linearisierten kinetischen Gleichung ( 1 4 ). Mit abnehmender Frequenz co tragen zunehmend größere Gruppen von Zentren zur Leitfähigkeit bei. Für co -»• 0 bleibt insbesondere nur der niedrigste Eigenwert des Stoßoperators übrig, welcher mit zunehmendem Volumen gegen Null geht, und eine nicht verschwindende Gleichstrom-Leitfähigkeit liefert. 183
0-2 0-3 0-4 0-5 0-6 0-7 0-8
As 2 Se3 +0.2 % Ag /AS2
Se3
1-0 M
S
2 3 9
io'° io"
1-2 8
7
6
5
a>
o LU
0-9
~6) Für 187
ein Verständnis genügt es jedoch nicht, diese Eigenschaften einzeln zu studieren, sondern es ist wünschenswert, ihre Zusammenhänge zu kennen. Von den dreidimensionalen Kristallen wissen wir z. B., daß die Zustände des idealen, periodischen Kristalls in Bändern angeordnet sind und Störstellen lokalisierte Elektronenzustände hervorrufen. Für die gemessenen Oberflächenzustände fct es nicht von vornherein klar, ob sie mit der periodischen Anordnung oder mit Störungen der Oberfläche zusammenhängen. Die Frage nach dem Ursprung der Oberflächenzustände ist also die Frage nach dem Zusammenhang zwischen den strukturellen und elektronischen Eigenschaften der Oberfläche. Qualitativ ist die Frage beantwortet, wenn experimentell gefundene Zustände strukturellen Eigenschaften zugeordnet werden können, oder wenn die den verschiedenen Oberflächenstrukturen zugehörigen Oberflächenzustände bestimmt werden können. In diesem Vortrag sollen derartige Zusammenhänge für die reinen Halbleiteroberflächen von Einkristallen untersucht werden. Reine Oberflächen, weil hier die chemischen und strukturellen Eigenschaften am besten bekannt sind und Halbleiteroberflächen, besonders Germanium und Silizium, weil hier die meisten elektrischen Messungen vorliegen. Bevor die Oberflächenzustände besprochen werden, soll zunächst die Struktur der Oberfläche behandelt werden.
2. Struktur der Oberfläche 2.1. Mögliche Oberflächenstrukturen Unter Struktur soll hier die geometrische Anordnung der Atome und die chemische Zusammensetzung verstanden werden. Verschiedene Strukturen lassen sich prinzipiell etwa in folgender Weise unterscheiden (Fig. 1). Im einfachsten Fall liegt eine reine Oberfläche vor, bei der alle Atome auch an der Oberfläche an den Plätzen sitzen, die von der Volumenstruktur her erwartet werden („ideale" Oberfläche). Die Periode an der Oberfläche gleicht der im Innern des Kristalls (angedeutet durch Pfeile in Fig. la). Eine periodische Anordnung liegt auch bei einigen Abweichungen von der idealen Oberfläche vor. Es kann beispielsweise eine Deformation in Form einer gleichmäßigen Verschiebung der obersten oder mehrerer Atomlagen in horizontaler oder vertikaler Richtung auftreten (Fig. lb). Eine häufig beobachtete Erscheinung ist die Überstruktur. Dabei sind die Oberflächenatome ebenfalls vertikal oder horizontal verschoben, jedoch nicht alle Atome in gleicher Weise. Wenn z. B. jedes zweite Atom angehoben ist oder je zwei Atome in beiden Achsenrichtungen zu Paaren zusammenrücken (Fig. lc), liegt auch eine periodische Anordnung vor, jedoch mit verdoppelter Periodenlänge. Auch eine un188
ideale Oberfläche
deformierte Oberfläche
Überstruktur
Domänengrenze /
»OOOO0o Ioooooo
a) unvollständige Deckschicht
geordnete Adsorption
È
yoo Di o ooooo o ooo oo
f)
Stufe
ungeordnete Adsorption
/o o ÖWTi o o/
00000000 h)
Fig. 1. Mögliche Gestaltsformen der Oberfläche, gezeigt an der ( 1 0 0 ) - 0 b e r f l ä c h e eines e i n f a c h kubischen Kristalls. Die Pfeile geben die Periodenlängen in den beiden Achsenrichtungen der Oberfläche an.
vollständige, jedoch geordnete Deckschicht (Fig. le) und eine geordnete Adsorption von Fremdatomen (vollständige oder unvollständige Schicht, Fig. l f ) ist denkbar. Bei den in den Figuren lc, le und lf gezeigten Beispielen ist zwar die Anordnung wesentlich verschieden, in den Perioden stimmen sie jedoch überein. Alle bisher erläuterten Beispiele beschreiben streng periodische Strukturen. Wie in dreidimensionalen Kristallen können jedoch auch Abweichungen von der Periodizität auftreten. Störungen der Periodizität der Oberfläche lassen sich nach der Dimension ordnen. Einzelatome auf der Oberfläche entsprechen den Fremdatomen im Innern. An den Oberflächen kann die Dichte jedoch bis zur Monoschicht ansteigen. Bei Erreichen der Monoschicht liegt dann gewöhnlich geordnete Adsorption vor, da meistens die Zahl der in einer Schicht adsorbierbaren Atome in einem einfachen Verhältnis zur Zahl der Oberflächenatome steht (z. B. 1:1 oder 1:2). Die einfachste eindimensionale Störung ist die Stufe einatomarer Höhe (Fig. lg). Dabei liegt eine periodische Anordnung nur noch in Richtung der Stufenkante vor. Vorzugsrichtungen der Stufen sind durch die Kristallstruktur gegeben (z. B. auf der (111)-Fläche des Diamantgitters ( 7 )). Bei den eindimensionalen Störungen zeigt die Oberfläche eine Besonderheit bei Vorhandensein von Überstrukturen: Durch die gegenüber der Unterlage vervielfachte Periode können die gleichen Überstrukturen in mehreren verschiedenen Domänen nebeneinander bestehen. Durch Translation bzw. Rotation lassen sie sich 189
ineinander überführen. Im Grenzbereich zwischen einheitlichen Domänen gibt es Atome, die zu keiner der Domänen gehören (Fig. ld). Dieser Grenzbereich bildet eine eindimensionale Störung der Oberfläche. Als zweidimensionale Störung soll schließlich noch die amorphe Deckschicht erwähnt werden, wie sie z. B. bei oberflächlicher Oxydation von Silizium und Germanium auftritt. 2.2. Experimentelle Bestimmung der Strukturen Zur Bestimmung der Oberflächengestalt gibt es verschiedene Verfahren, die die chemische Zusammensetzung der obersten Schicht oder die kristallographische Anordnung liefern. Auch wenn das Experiment mit einer reinen Oberfläche begonnen wurde (z. B. Spalten im Ultrahochvakuum (8>9) oder Reinigung durch Beschuß mit Argonionen und anschließendes Glühen zum Ausheilen der Gitterschäden ( 1 0 )), ist es wünschenswert die Reinheit (z. B. nach einer Wärmebehandlung) oder die Art und Menge von adsorbierten Atomen festzustellen. Eine chemische Analyse ist durch Untersuchung von inelastisch gestreuten Elektronen möglich. In der Energieverteilung der die Probe verlassenden Elektronen treten durch Augerprozesse freigesetzte Elektronen mit Energien auf, die sich für verschiedene Elemente unterscheiden. Durch Amplituden- und Energiebestimmung solcher Augerelektronen läßt sich die chemische Zusammensetzung der obersten Schichten qualitativ und quantitativ ermitteln Augerelektronenspektroskopie) ( 1 1 - 1 4 ). Die Empfindlichkeit beträgt etwa 1CT2—10"3 einer Monoschicht, durch die letzten Entwicklungen ( 1S ) sollte eine noch höhere Empfindlichkeit erreicht werden. Eine Oberflächenanalyse ist auch mit Hilfe der durch Argonbeschluß induzierten Ionenemmision möglich ( 1 6 ). Die bis jetzt erreichte Genauigkeit ist jedoch zur Analyse einer beliebigen Oberfläche noch nicht ausreichend. Denn die elektrischen Meßmethoden wie Oberflächenleitfähigkeit und Feldeffekt sind zwar unspezifische, aber sehr empfindliche Nachweismethoden. So kann beispielsweise bei einer Siliziumspaltfläche nach Wasserdampfadsorption durch 10 10 Elementarladungen/cm 2 die Bandverbiegung erheblich verändert werden ( 9 ). Es müßten also weniger als 10 10 Störatome/cm 2 nachweisbar sein, um Effekte nicht meßbarer Konzentrationen von Fremdatomen auf die elektrischen Eigenschaften vernachlässigen zu können. In vielen Fällen ist jedoch die Genauigkeit von 10 12 /cm 2 (0,1 % einer Monoschicht) ausreichend, um Adsorptionsprozesse studieren zu können. Die Anordnung der Oberflächenatome wird am häufigsten mit Hilfe der Beugung langsamer (LEED) oder schneller (RHEED) Elektronen bestimmt ( 5 ' 6 ) . Durch die geringe Eindringtiefe der Elektronen ist das Beugungsbild ausschließlich durch die obersten Atomlagen bestimmt. Verschiedene Informationen lassen sich aus dem Beugungsbild entnehmen. Das Verhältnis der Intensitäten in den Reflexen zur Untergrundintensität gibt qualitativ Auskunft über die Ordnung an der Oberfläche: Bei einer amorphen Deckschicht mehrerer Atomlagen sieht man keine Reflexe, nur 190
einen gleichmäßigen Untergrund, bei einer vollkommen geordneten Oberfläche beobachtet man scharfe Reflexe bei minimaler Untergrundintensität. Das Auftreten von Reflexen, die für die ideale Oberfläche nicht zu erwarten sind, ist das Kennzeichen für eine Überstruktur. Bei einer Überstruktur gemäß Fig. l c würde zwischen je zwei Normalreflexen (d. h. Reflexen, die bei der idealen Oberfläche auftreten) ein zusätzlicher „Extrareflex" auftreten, der deshalb halbzahlige Indizes bekommt. Da die Elementarmasche in beiden Achsenrichtungen verdoppelt ist, würde diese Überstruktur die Bezeichnung 2 X 2 erhalten. Regelmäßige Stufenreihen spalten einige Reflexe in Doubletts auf ( 7 > 17 ) unregelmäßig verteilte Stufen lassen einen Teil der Reflexe unscharf erscheinen ( 1 8 ) . Stufenhöhe und Stufenbreite können ohne zusätzliche Messungen aus dem Beugungsbild ermittelt werden ( 7 ) . Domänengrenzen lassen sich aus der Aufspaltung bzw. Unschärfe der Extrareflexe bzw. direkt aus dem Vorhandensein von Domänen mit verschiedenen Symmetrieebenen schließen ( 1 9 ' 2 0 ) . Eine quantitative Abschätzung ist bei großer Zahl von Domänengrenzen möglich. Geordnete Adsorption (weniger als Monoschicht) zeigt sich wie eine Überstruktur in Extrareflexen. Fig. 2 zeigt einige Beispiel von LEED-Beugungsbildern für verschiedene Oberflächenstrukturen. Die bisher aufgeführten Informationen wurden allein aus dem Ort der Beugungsreflexe abgeleitet. Damit läßt sich vollständig die Größe, Form und Symmetrie der Einheitsmasche auf der Oberfläche bestimmen. Für die Anordnung der Atome innerhalb dieser Masche benötigt man die Intensität der Reflexe, die unter Berücksichtigung der Vielfachstreuung der Elektronen berechnet werden kann ( 6 ) . Die bisher durchgeführten Rechnungen liefern besonders dann direkte Informationen über die Atompositionen, wenn Vielfachstreuung vernachlässigbar ist oder weggemittelt werden kann. So wurde am festen Xenon bei Energien über 50 eV eine Intensität gefunden, die rein kinematisch ableitbar ist ( 2 1 ) . Die Auswertung zeigt, daß die Atome innerhalb der erreichten Genauigkeit auf den von der Volumenstruktur erwarteten Plätzen sitzen, es liegt also eine ideale Fläche vor. In anderen Rechnungen wird gezeigt, daß Vielfachstreuungen nach Mittelbildung über einen Energiebereich oder einen Winkelbereich vernachlässigbar sind ( 2 2 ) . Es ist zu hoffen, daß bald für alle Oberflächen die Lage der Atome in der Elementarmasche der Oberflächenstruktur aus den Intensitäten der Elektronenbeugung bestimmt werden kann.
3. Oberflächenzustände 3.1. Eigenschaften und Einteilung Bevor ausführlicher über Oberflächenzustände gesprochen wird, soll zunächst eine Definition gebracht werden. Ein mit einem Elektron besetzbarer Zustand heißt Oberflächenzustand, wenn ein Elektron in diesem Zustand an der Oberfläche lokalisiert ist. Die Aufenthaltswahrscheinlichkeit des Elektrons geht also mit zunehmender Entfernung von der Oberfläche (nach innen und nach außen) gegen null (Fig. 3). Entlang der Oberfläche kann die Wahrscheinlichkeit konstant sein bzw. mit der 191
Fig. 2. LEED-Beugungsbilder als Beispiele zur Bestimmung der Oberflächengestalt: a) Germanium-(111)-Fläche, unmittelbar nach Spalten im Ultrahochvakuum: Überstruktur mit verdoppelter Periode bei großen Domänen. Die halbzahligen Reflexe sind von den Normalreflexen hier nur durch Variation der Spannung unterscheidbar ( 4 0 ) . b) Aufspaltung von Normalreflexen durch regelmäßige Stufenreihen auf Germaniumspaltfläche (keine Extrareflexe vorhanden) ( 7 > 7S ). c) Germaniumspaltfläche nach Erhitzen bis 120°C für 5 min im Ultrahochvakuum: Überstruktur mit unscharfen Extrareflexen wegen kleiner Domänen ungleicher Größe ( 4 0 ) . d) Überstruktur durch geordnete Adsorption von weniger als einer Monoschicht Silber auf einer Silizium-(1 ll)-Fläche ( s ) . Die Normalreflexe liegen auf den Eckpunkten der durch die Reflexe aufgespannten großen Dreiecke, die Reflexe auf den Seiten der Dreiecke entstammen der Überstruktur.
192
Vakuum £
Kristall
' / / / / / / / / / / / / / / / , Leitungsband Oberflächenzustand ' / / / / / / / / / / / / / / / Valenzband
Oberflächenzustand (schematisch)
Fig. 3 Energetische Lage und Wellenfunktion eines Oberflächenzustandes eines eindimensionalen Kristalls.
Abstand z von der Oberfläche
Gitterperiode oszillieren (nicht-lokalisierter Zustand) oder mit zunehmender Entfernung von Zentrum oder der Achse des Zustandes verschwinden (lokalisierter Zustand). Von den zahlreichen theoretischen Ergebnissen (Übersieh* in ( 4 ) ) sollen hier nur qualitative Ergebnisse behandelt werden, die generell für alle Oberflächen gelten sollten. Berechnungen von Oberflächenzuständen sind nur in Sonderfallen für quantitative Vergleiche mit dem Experiment geeignet. Hier soll deshalb besonderes Gewicht darauf gelegt werden, wie die Struktur der Oberfläche die elektronischen Zustände qualitativ beeinflußt. Die im vorigen Abschnitt behandelte Gestalt hat einen grundsätzlichen Einfluß. Eine periodische Oberfläche kann nur nicht-lokalisierte Zustände haben. Durch Störungen der Periodizität werden zusätzlich lokalisierte Zustände hervorgerufen. Beschränken wir uns zunächst auf die ideale, also die einfachste Oberflächenstruktur. Die wichtigste Frage ist, ob und in welchen Energiebereichen Oberflächenzustände auftreten. Dazu benötigt man eine Wellenfunktion, die ins Vakuum und ins Kristallinnere abfällt. Der Zustand muß also unter dem Vakuumpotential liegen und außerdem in einer verbotenen Zone des Kristalls, da hier nach innen abfallende Wellenfunktionen existieren (Fig. 3). Gehen wir auf eine vereinfachte eindimensionale Darstellung der Energie E als Funktion der Wellenzahl k, so können wir mögliche Oberflächenzustände hier in den verbotenen Zonen erwarten, falls sich eine ins Vakuum abfallende Funktion anschließen läßt (Fig. 4). Bei Oberflächen dreidimensionaler Kristalle muß noch eine reelle Komponente des k-Vektors parallel zur Oberfläche berücksichtigt werden. Die Oberflächenzustände liegen nicht mehr auf einem scharfen Niveau, sondern sind zu einem Band geworden, das in der gezeichneten Weise 13 Festkörperprobleme X I
193
c
ID
Weltenzahl
kz
i senkrecht ] Izur Oberfläche I gestrichelt: komplexes k z
zur
parallel Oberflächel >o
Fig. 4 Ausdehnung der Oberflächenbänder im k-Raum (schematisch für (lOO)-Fläche eines einfach kubischen Kristalls), a) Schnitt in z-Richtung (senkrecht zur Oberfläche) für k x = k y = 0. Mögliche Oberflächenzustände nur für komplexes k z (gleichzeitig Modell für eindimensionalen Kristall).
b) Schnitt in x-Richtung (parallel zur Oberfläche) mit k y = 0, k z alle Werte. Für jedes k x treten ein Oberflächenzustand und viele Volumenzustände (wegen verschiedener k z -Werte) auf. Der Energiewert des Oberflächenzustands liegt in der vom k x -Wert abhängigen Energielücke.
mit den Bändern des unendlichen Kristalls überlappen kann. Die Zahl der Zustände in einem Oberflächenband ist dabei gleich der Zahl der Oberflächenatome. Diese Zahl ist allerdings nur eine Maximalzahl, da Zustände nicht in jeder verbotenen Zone existieren müssen. So wurde theoretisch von Jones ( 23 ) und Heine ( 24 ) gezeigt, daß auf der reinen Oberfläche von Germanium und Silizium in der verbotenen Zone zwischen Leitungs- und Valenzband Oberflächenzustände existieren sollten, nicht jedoch nach Aufbringen einer Oxydschicht, da die Anpaßbedingungen dadurch entscheidend verändert werden. Im vorigen Abschnitt wurde gezeigt, daß die Oberflächenstruktur häufig von der Idealstruktur abweicht. Auswirkungen auf die Oberflächenzustände wurden theoretisch nachgewiesen. Z. B. wirkt eine gleichmäßige Verschiebung der obersten Schicht sich stark auf Existenzbedingung und energetische Lage der Oberflächenzustände aus, nicht jedoch auf deren Maximalzahl ( 2S ). Falls jedoch mehrere Atomlagen von der Deformation betroffen sind, vervielfacht sich die Maximalzahl möglicher Zustände pro verbotene Zone ( 2 6 , 27 ). Eine Überstruktur (Fig. lc) verändert die Oberflächenbänder wesentlich. In Fig. 5 ist schematisch der Energie-Wellenzahlzusammenhang für ein Oberflächenband gezeichnet. Die x-Richtung liege in der Oberfläche, a sei die Gitterkonstante in dieser Richtung. Die gestrichelte Kurve zeigt den Verlauf bei idealer Oberfläche (siehe auch Fig. 4). Wenn durch Überstruktur die Gitterkonstante in Richtung von k x verdoppelt ist (Fig. lc), tritt die Brillouin'sche Zonengrenze schon beim halben kx-Wert auf. Falls die Abweichungen von der idealen Oberfläche gering sind, ist der Bandverlauf nur 194
Fig. 5
W e l l e n z a h l kx
Einfluß einer Überstruktur auf Oberflächenbänder (schematisch). Gestrichelt: ideale Oberfläche; erlaubte Energiebereiche rechts. Ausgezogen: Oberfläche mit Überstruktur, die durch kleine Abweichungen von der idealen Oberflächen entstanden ist (z. B. Fig. lc); erlaubte Energiebereiche links.
| parallel j Izur Oberfläche!
in der Nähe der neuen Brillouin'sehen Zonengrenze verändert. Die erlaubten Bänder (ausgezogene Kurve) werden also durch die Vervielfachung der Gitterkonstante aufgespalten, wobei jedes Band einen Zustand pro Elementarmasche enthält. Da die Elementarmasche gegenüber der idealen Oberfläche vergrößert ist, tritt bei Überstruktur eine geringere Zahl von Zuständen pro Band auf. Bei Überstrukturen mit stärkeren Abweichungen von der idealen Oberfläche (siehe z. B. Fig. le und l f ) sind die Teilbänder stärker gegenüber denen in Fig. 5 verändert. Es kann auch nicht ausgeschlossen werden, daß z. B. nur ein Teilband überhaupt existiert oder die Teilbänder sich überlagern. Eine geordnete Adsorptionsschicht sollte sich qualitativ wie eine deformierte Deckschicht auf die Oberflächenzustände auswirken. Allen bisher besprochenen Fällen ist gemeinsam, daß es sich um eine periodische Oberfläche mit folglich ausgedehnten, nicht lokalisierten Oberflächenzuständen in Bändern handelt. Auch Störungen der Periodizität wirken sich auf die Zustände aus. Eine geringe Zahl von Punktstörungen auf der Oberfläche sollte diskrete Zustände entsprechend den bekannten Verhältnissen im Kristallinnern hervorrufen können. Bei großer Dichte werden Störbänder wie im Volumen erwartet. Da die Dichte von Punktstörungen an der Oberfläche (z. B. adsorbierte Fremdatome) bis zur Zahl der Oberflächenatome anwachsen kann, ist zu berücksichtigen, daß jede Punktstörung neben der Erzeugung eines Oberflächenzustandes möglicherweise einen nicht lokalisierten Oberflächenzustand der reinen Fläche verändert oder gar zum Verschwinden bringt. Volumenstörstellen in der Nähe der Oberfläche (z. B. innerhalb der ersten 10 Atomlagen) zeigen einen veränderten Energiewert. Sie bilden damit eine besondere Art von Oberflächenzuständen ( M ) . 195
Bei eindimensionalen Störungen (z. B. Stufe, Domänengrenze) liegt wie bei Versetzungen im Innern des Kristalls ( 29 ) ein periodisches Potential in einer Richtung vor. Es sollte also ein Band mit scharfen Kanten und einer Dichteverteilung mit E" an den Bandkanten auftreten. Die Struktur der Oberfläche hat also wesentlichen Einfluß auf die Oberflächenzustände. Es soll deshalb jetzt eine Einteilung vorgenommen werden, die sich auf die Struktur stützt (Tab. 1). Die Hauptunterscheidung ist zwischen nicht-lokalisierten und lokalisierten Zuständen, je nachdem ob sich die Zustände auf die Periodizität oder auf Störungen beziehen. Innerhalb der nicht-lokalisierten Zustände ist die chemische Zusammensetzung wesentlich. Die weitere Unterteilung wird nach der Überstruktur bzw. Deformation vorgenommen. Durch Überstruktur beispielsweise entstehen möglicherweise keine neuen Zustände, sonder die Zustände der idealen Oberfläche werden nur verändert. Die Zustände sollen der Überstruktur in diesem Falle nur dann zugeordnet werden, wenn diese Änderung wesentlich ist. Die Unterteilung zielt auf die entscheidenden Merkmale, wobei möglicherweise eine Abhängigkeit von Meßmethode und Meßempfindlichkeit in Kauf genommen werden muß.
Tabelle 1: Einteilung der Oberflächenzustände 1. nicht-lokalisierte
Zustände
auf periodischen Oberflächen folgender
ideal
rein
mit Deformation ohne Überstruktur mit Überstruktur
Struktur
2. lokalisierte
Zustände
auf Oberflächen mit folgenden Störungen
mit geordneter
ohne Überstruktur
Adsorptionsschicht
mit Überstruktur
0
unvollständige oberste Schicht ungeordnete Adsorptionsschicht Volumenstörstellen nahe der Oberfläche
1
Stufen Domänengrenzen
2
amorphe Deckschicht
Dim. der Störung
Die Unterscheidung von den lokalisierten Zuständen ist jedoch streng möglich. Hier ist auch im Prinzip jedenfalls eine Zuordnung zu den Ursachen eindeutig denkbar. Denn die Zahl der Zustände gleicht der Zahl der mit den Störungen verknüpften Atome. Während die Zahl von nicht-lokalisierten Zuständen normalerweise gleich der Zahl der Oberflächenatome ist, ist die Zahl lokalisierter Zustände wesentlich niedriger. 196
3.2. Experimentelle Methoden Wünschenswert wäre es, Oberflächenzustände direkt zu messen. Bei einer elektrischen Leitfähigkeit innerhalb der Bänder der Oberflächenzustände könnte man die Eigenschaften ebenso wie bei den Volumenzuständen (z. B. Bandabstand aus Temperaturabhängigkeit der Eigenleitung, Störniveaus aus Störleitung) ermitteln. Bisher konnte man jedoch eine Leitfähigkeit in den Oberflächenzuständen nicht nachweisen ( 3 0 ). Der Grund liegt möglicherweise in einem unbekannten Streumechanismus für Elektronen in Oberflächenzuständen. Deshalb werden die Oberflächenzustände indirekt über die Raumladungsschicht gemessen. Falls die Ladung in den Oberflächenzuständen nicht gerade null ist, tritt eine entgegengesetzt gleiche Ladung in der Randschicht des Halbleiters und damit eine Verbiegung der Volumenbänder in der Nähe der Oberfläche auf. Aus den Eigenschaften dieser Raumladungsschichten lassen sich Rückschlüsse auf die Oberflächenzustände ziehen. Die vielfältigen Verfahren (z. B. Oberflächenleitfähigkeit, Feldeffekt, lichtelektrische Methoden, Oberflächenkombination) sind in den Lehrbüchern und zusammenfassenden Berichten ausführlich dargestellt ( 1 _ 4 ). Neuerdings werden mehr direktere Methoden verwendet, bei denen Übergänge von Elektronen aus Oberflächenzuständen in das Vakuum oder Leitungsband oder andere Oberflächenzustände benutzt werden: Feldemission ( 31 ), Photooberflächenleitung ( 32 ), Photoelektronenemission ( 33 ) und optische Absorption ( M ) . Hier interessiert noch mehr die Frage, wie experimentell gefundene Oberflächenzustände den einzelnen Gruppen der Zustände zugeordnet werden können. Verschiedene Methoden erscheinen geeignet, Informationen über die Zuordnung abzuleiten: 1. Wie im vorigen Kapitel ausgeführt, ist die Anzahl der erwarteten nicht-lokalisierten Zustände normalerweise gleich der Zahl der Oberflächenatome, falls überhaupt vorhanden, bei lokalisierten Zuständen jedoch gleich der Zahl der mit der Störung verknüpften Atome, also normalerweise wesentlich niedriger als die Zahl der Oberflächenatome. Wenn also die Gesamtzahl bzw. eine obere oder untere Grenze der Zustandszahl bekannt ist, läßt sich möglicherweise eine Unterscheidung zwischen lokalisierten und nicht-lokalisierten Oberflächenzuständen treffen. 2. Am einfachsten geht es im Prinzip wenigstens, wenn man experimentelle und gerechnete Werte direkt miteinander vergleicht und die Gestalt der Oberfläche rechnerisch solange variiert, bis man Übereinstimmung mit dem Experiment und damit gleichzeitig die für die Oberflächenzustände wesentlichen Parameter gefunden hat. Eine Voraussetzung ist allerdings, daß man einerseits genügend genaue und vollständige experimentelle Daten für die Oberflächenzustände hat, andererseits rechnerisch die Oberflächengestalt berücksichtigen kann, falls notwendig. Beide Bedingungen sind meistens kaum erfüllbar, so ist bisher ein direkter Vergleich nur in Sonderfällen möglich. 197
3. Statt einer rechnerischen Variation der Oberflächengestalt kann man jedoch auch experimentell die Gestalt der Oberfläche variieren und gleichzeitig mit irgendeiner Methode die Oberflächenzustände messen. Findet man eine korrelierte Änderung der Oberflächenzustände, so ist der variierte Parameter der Oberflächengestalt wesentlich für die gemessenen Zustände. Um eine eindeutige Zuordnung zu erhalten, muß allerdings ein einziger Oberflächenparameter selektiv verändert werden. Eine selektive Änderung ist nicht für jeden Parameter ohne weiteres möglich. Daneben stehen eine Reihe von Vorteilen: Durch ein derartiges Experiment ist eme Zuordnung auch zu Untergruppen der Zustände möglich. Man kommt mit der Messung einer einzigen, vielleicht sogar indirekten Eigenschaft der Oberflächenzustände aus (z. B. Bandverbiegung auf der Halbleiteroberfläche), und man benötigt keinerlei Berechnung von Oberflächenzuständen. Im folgenden werden nun eine Reihe von Experimenten beschrieben, die eine Information zum Ursprung der Oberflächenzustände liefern, insbesondere sollen die Methoden und Ergebnisse erläutert werden, bei denen eine selektive Veränderung eines Parameters der Oberflächenstruktur möglich ist bzw. bereits durchgeführt wurde.
4. Experimentelle Ergebnisse 4.1. Gesamtzahl der Zustände Zunächst sollen Ergebnisse betreffend Gesamtzahl der Zustände berichtet werden. Da experimentell immer nur ein Teil der Oberflächenzustände erfaßt wird, kann man aus den Messungen nur eine Mindestzahl von Zuständen pro Flächeneinheit ableiten. Berichtete Mindestzahlen sollen hier zusammengestellt werden. Aus der Änderung der Austrittsarbeit reiner Silizium- und Germanium-Spaltflächen mit der Volumendotierung wurde auf eine Mindestzahl von etwa 1 0 1 3 / c m 2 geschlossen ( 3 S ) . Durch Hinzunahme von Messungen bis in die Entartung dotierter Proben folgt für Silizium eine untere Grenze von etwa 2 X 1 0 1 4 / c m 2 ( 3 S ) . Die in der Arbeit angegebene Zahl von 8 X 1 0 1 4 / c m 2 ist eine zur Deutung der Ergebnisse benutzte Annahme (zur Diskussion siehe ( 3 6 ) ) . Aus der Feldeffektbeweglichkeit und der Oberflächenleitfähigkeit wurde für reine Germanium- und Siliziumspaltflächen ebenfalls etwa 1 0 1 3 / c m 2 als Mindestzahl bestimmt. ( 9 . 3 7 > 3 8 ) Die gleiche Mindestzahl folgt aus Messungen der Oberflächenleitfähigkeit bei Cs-Bedeckung der reinen Siliziumspaltfläche. ( 3 9 ) Durch Untersuchung der Strukturumwandlung auf der reinen Germaniumspaltfläche wird eine Mindestzahl von 6 X 1 0 1 3 / c m 2 abgeleitet ( 4 0 ) . Für Silizium- und Germanium-Oberflächen, die mit Argonbeschuß und Glühen gereinigt waren, werden aus der Feldeffektbeweglichkeit untere Grenzen zwischen 1 0 1 3 und 1 0 1 4 / c m 2 bestimmt C 4 1 " 4 4 ). 198
Die meisten Experimente liefern keine Aussage darüber, ob die Zustände als diskrete Niveaus oder in Bändern vorliegen. In den veröffentlichten Verteilungen von Zuständen werden häufig diesbezügliche Annahmen gemacht, um die Ergebnisse darstellen zu können. Nur wenn der Abstand Ferminiveau-Eigenleitungsniveau an der Oberfläche im Experiment genügend weit (viele kT) verändert werden kann, sind Aussagen über die Verteilung der Zustände in diesem Energiebereich möglich. Für die reine Oberfläche liegt nur ein Ergebnis vor: Mit Hilfe des „chemischen" Feldeffektes wurde für Siliziumspaltflächen ein Band von 2 kT Breite mit jedoch nur 3 X 1012 Zuständen/cm 2 gefunden. Ein weiteres Band unbekannter Breite zeigte sich am unteren Rand des überstrichenen Energiebereiches ( 3 9 ). Durch photoelektrische Messungen wurden zahlreiche III-V und II-VI Verbindungen untersucht ( 4 S ). (Zusammenfassung in ( 4 )). Auf den im Ultrahochvakuum hergestellten Spaltflächen wurden Oberflächenzustände nahe den Bandkanten gefunden. Da meistens nur bei einer Dotierung gemessen wurde, konnten keine Aussagen über die Dichte gegeben werden. Die Ergebnisse bezüglich der energetischen Lage lassen sich gut durch die von Levine und Mark ( 46 ) berechneten Zustände auf Ionenkristallen erklären. Es liegen hier möglicherweise Zustände der idealen Oberfläche vor (da mit LEED keine Überstruktur festgestellt wurde). Die nun folgenden Experimente sind geordnet nach dem Strukturparameter der im Experiment besonders untersucht wurde.
4.2. Überstruktur der reinen Oberfläche Die reinen Oberflächen von Silizium und Germanium zeigen Überstrukturen. Auf den Spaltflächen wurden ohne Anwesenheit von Fremdatomen zwei verschiedene Überstrukturen gefunden ( 4 7 ): Unmittelbar nach dem Spalten bei Zimmertemperatur tritt eine 2 X 1 Überstruktur auf (Fig. 2a), die zwar bei Zimmertemperatur stabil ist, jedoch durch eine Wärmebehandlung (120 °C für Ge ( 4 °), 350 °C für Si ( 4 8 )) von wenigen Minuten Dauer irreversibel in eine andere Überstruktur übergeht (Si: 7 X 7, Ge: 8, Fig. 2c). Die Überstruktur kann also selektiv verändert werden, ohne insbesondere etwas an der chemischen Zusammensetzung der Oberfläche zu ändern. Der erste Hinweis einer damit korrelierten Änderung der Oberflächenzustände wurde mit Hilfe von photoelektrischen Messungen gegeben ( 3 5 ' 4 9 ). Es wurde gezeigt, daß die Bandverbiegung auf der reinen Spaltfläche von Germanium und Silizium durch Wärmebehandlung, die die Struktur verändert, irreversibel verändert wird. Da diese Messung nur für eine einzige Dotierung durchgeführt wurde, konnten weitergehende Schlüsse auf Dichte und Verteilung der Zustände nicht gezogen werden. Ein weiterer Hinweis stammt von Austrittsarbeitsmessungen an Siliziumspaltflächen, wobei irreversible Änderungen durch Wärmebehandlung gefunden wurden ( 5 0 ). Ausführlichere Messungen der Strukturumwandlung der Germaniumspaltfläche wurden mit Hilfe von Oberflächenleitfähigkeit und Gleichspannungsfeldeffekt bei gleichzeitiger 199
X
ü
JC
\X
0 0
—
—
-5 -10 -15 100
o u Ol |M 41 50 |t» "o .O > « 0 E "5 u.
2x1 X
«i .O N 3c w C — « ö» -J) ~
0 >
X
9
v 1 '
V
0> 01 a o S-» o, CL .e o tn i _ m Uj U,
-8 10
1
1
1
1 1
-4 10*
1
Zusammenhang von adsorbierter Menge und Oberflächenzuständen bei der Adsorption von Sauerstoff auf reinen Germanium-(111)-Flächen durch gleichzeitige Messung der Intensitäten des LEED-Beugungsbildes zur Strukturbestimmung (oben), der Änderung der Oberflächenleitfähigkeit Aa - Acto (Mitte) und der Feldeffektbeweglichkeit Mfe (unten) zur Bestimmung von Bandverbiegung und Zustandsdichte ( 6 0 ) . Die adsorbierte Menge steigt mit der Dosis monoton an und hat bei der höchsten angegebenen Dosis etwa eine Monoschicht erreicht.
Sauerstoffdosis (Torr min)
biegung und Feldeffektbeweglichkeit entsprechen dabei denen bei der durch Wärmebehandlung ausgelösten Strukturumwandlung. Der dominierende Effekt ist bis 10" 4 Torr min H 2 0 die Strukturumwandlung, dagegen treten neue, durch die Wasseradsorption erzeugte Zustände offensichtlich erst bei einer Dosis über 10~3 Torr min deutlich hervor. Gut untersucht ist ebenfalls die Adsorption von Alkalimetallen auf reinen Germanium- und Siliziumspaltflächen. Bei größeren Bedeckungen (über etwa 10 %) können Überstrukturen auftreten. Jedoch kann die Verteilung bei geringen Bedeckungen als statistisch angenommen werden. Die Änderung der Oberflächenzustände während der Adsorption von Caesium ist durch eine Messung der Oberflächenleitfähigkeit der Siliziumspaltfläche als Funktion der Bedeckung bestimmt worden ( 3 9 ). Die experimentellen Werte lassen sich gut durch ein Modell beschreiben, in dem jedes adsorbierte Caesiumatom den zwei auf der reinen Oberfläche noch nicht vorhandenen diskreten Niveaus (oder Bändern) je einen Zustand zufügt und gleichzeitig die beiden vorhandenen Bänder von Ober205
flächenzuständen der reinen Spaltfläche abbaut. Es liegt also ein ähnlicher Mechanismus vor, wie er fur die Sauerstoffadsorption auf Germanium gefunden wurde. Da gleichzeitige Messungen des LEED-Beugungsbildes für die Caesiumadsorption noch nicht vorliegen, ist der Einfluß auf die Überstruktur der reinen Spaltfläche noch nicht untersucht.
5. Diskussion 5.1. Die reine Oberfläche Auf Grund der berichteten Ergebnisse soll nun diskutiert werden, inwieweit sich die beobachteten Zustände den in der Einteilung gegebenen Gruppen von Oberflächenzuständen zuordnen lassen. Dazu soll zunächst die Gestalt der reinen Oberfläche insbesondere deren Störungen kurz besprochen werden. Verunreinigungen aus der Gasphase können beim heutigen Stand der Ultrahochvakuumtechnik weitgehend ausgeschlossen werden. Denn bei einem Druck von 1CT10 Torr und einem Haftkoeffizienten von 10"2 werden in einer halben Stunde 0,1 % einer Monoschicht, d.h. etwa 1012 Atome/cm 2 adsorbiert. Da der Partialdruck aktiver, d. h. adsorbierbarer Gase gewöhnlich wesentlich niedriger liegt, ist die adsorbierte Menge praktisch ohne Einfluß. In Adsorptionsexperimenten wurde gezeigt, daß erst etwa 10~7 Torr min Sauerstoff oder Wasserdampf auf reinen Germanium- und Siliziumoberflächen einen meßbaren Effekt auf die Oberflächenzustände ausüben. Verunreinigungen aus dem Material spielen bei Spaltflächen kaum eine Rolle. Denn bei einer Volumendotierung von 1012—1016 cm" 3 liegen in der obersten Atomlage nur 104—108 Fremdatome/cm 2 , eine vernachlässigbare Dichte. Ist jedoch eine Glühbehandlung (z. B. zum Ausheilen der Gitterschäden nach Argonbeschuß) erforderlich, so kann durch Diffusion zur Oberfläche die Konzentration der Fremdatome an der Oberfläche stark anwachsen (z.B. Kohlenstoff auf Metallen ( 6 3 ' 6 4 ) . Über Eigenstörstellen der Oberfläche auf Grund fehlender oder überzähliger Atome der obersten Schicht gibt es nur Abschätzungen ( 65 ), die bei niedrigen Temperaturen und niedrig indizierten Flächen äußerst geringe Fehlerdichten voraussagen. Auf Grund der hohen Brillianz der LEED-Beugungsbilder kann die Konzentraiton von Fehlern der obersten Schicht nicht groß sein. Eigenfehlstellen werden deshalb im folgenden vernachlässigt. Stufen sind eine häufig beobachtete Störung von Oberflächen. Auf Spaltflächen wurden durch Dekoration im Elektronenmikroskop Stufendichten mit 1012—1013 Kantenatomen/cm 2 nachgewiesen, also etwa 0,1—1 % der Oberflächenatome ( 6 6 ' 6 7 ). Mit Elektronenbeugung wurden bis zu 20 % der Oberflächenatome als Kantenatome nachgewiesen ( 7 ). Mit einer lichtoptischen Methode wurde nach Mittelung über
206
eine Spaltfläche von Silizium und Germanium etwa 1 bis 5 % der Oberflächenatome an Kanten gefunden ( 6 8 ). Durch Auswahl „guter" Flächen können Werte unter 1 %, d. h. unter 10 13 Kantenatome/cm 2 , erreicht werden. Bei ionenbeschossenen Oberflächen hängt die Dichte der Stufen stark von der Temperatur der nachfolgenden Wärmebehandlung ab. Ohne Wärmebehandlung liegt meistens eine amorphe Oberfläche vor. Nach mittlerem Tempern (z. B 350 °C, 5 min für die (110) Oberfläche von GaAs) ist die Oberfläche mit vielen unregelmäßigen Stufen bedeckt ( 1 8 ). Die Zahl der Kantenatome liegt zwischen 10 13 und 10 l 4 /cm 2 . Durch ausreichendes Glühen (550 °C für GaAs (110)) nimmt die Dichte der Stufen stark ab ( < 10 13 Kantenatome/cm 2 ). Mit Hilfe elektronenmikroskopischer Durchstrahlungsaufnahmen wurde gezeigt, daß in einem Teil der Spaltfläche durch den Spaltvorgang netzförmig angeordnete Versetzungen knapp unter der Obcrfläche entstehen können ( 6 9 ). Da der Abstand der Versetzungen zu etwa 1 ju angegeben wird, ist die gemittelte Dichte der Atome in den Versetzungen nur etwa lO'^/cm 2 . Wenn man von den bisher besprochenen Störungen absieht, ist die reine Oberfläche periodisch. Sie bildet Überstrukturen aus. Eine Deformation (Fig. lb) läßt sich nicht ausschließen. In jedem Fall können mit der periodischen Oberfläche ebensoviele Oberflächenzustände verbunden sein wie Oberflächenatome vorhanden sind (etwa 5 - 8 X 10 14 /cm 2 je nach Fläche). Durch die Störungen können soviel Zustände hervorgerufen sein, wie Atome damit verknüpft sind ( < 10 13 /cm 2 ). Experimentell ist nachgewiesen, daß die reine Oberfläche von Germanium und Silizium mindestens 10 13 bis 10 14 Zustände/cm 2 besitzt. Eine obere Grenze läßt sich aus den Messungen nicht ableiten. Die Zahl der auf der Spaltfläche vorhandenen Störungen reicht nicht aus, um die große Zahl nachgewiesener Zustände hervorrufen zu können. Es müssen also die meisten Zustände der reinen Oberfläche nicht lokalisierte Oberflächenzustände sein. Dieser Schluß wird durch die Untersuchung der Strukturumwandlung bestätigt. ( 40 ) Denn aus dem Ergebnis, daß die selektive Veränderung der Überstruktur die Oberflächenzustände wesentlich verändert, folgt unmittelbar, daß die vorhandenen Oberflächenzustände von der periodischen Struktur abhängen, d. h. nicht-lokalisierte Oberflächenzustände sein müssen. Die Zustände der reinen Oberfläche sind also weitgehend nicht-lokalisierte Oberflächenzustände, die in ihrer energetischen Lage durch die Abweichungen von der idealen Oberfläche wesentlich bestimmt sind. Die Zahl der Zustände beträgt mindestens ein Zehntel der Zahl der Oberflächenatome, Gleichheit ist wahrscheinlich. Die Verteilung der Zustände auf der Energieskala ist noch ziemlich unbekannt. Eine Aufspaltung in zwei oder mehr Bänder ist an Spaltflächen wahrscheinlich. Daneben können jedoch Störungen der Oberfläche zusätzlich Zustände hervorrufen oder vorhandene ändern bis zu etwa der Zahl, die durch die Zahl der Atome in den Störungen gegeben ist. Die Störungen, besonders die Stufen sind möglicherweise für die Streuung berichteter Meßwerte verantwortlich. 207
5.2. Oberflächen mit Fremdatomen Durch adsorbierte Fremdatome auf reinen Oberflächen werden lokalisierte Zustände eingeführt. Es müssen jedoch noch zusätzliche Effekte der Adsorption berücksichtigt werden. Die adsorbierten Atome können vorhandene Zustände verändern. Außerdem kann die Anordnung der obersten Kristallschicht in einer Überstruktur durch die Adsorption verändert werden, was wiederum Einfluß auf die Oberflächenzustände hat. Falls die adsorbierte Mengen einen erheblichen Bruchteil einer Monoschicht darstellt, spielt schließlich auch die Anordnung der adsorbierten Atome eine Rolle. Es ist zu erwarten, daß bei gleicher Menge, jedoch verschiedener Anordnung des Adsorbates verschiedene Verteilungen der Oberflächenzustände auftreten werden. Für im Elektrolyten gereinigte (70> 7 1 ) oder mit Oxid bedeckte Oberflächen (72,73,74) werden im allgemeinen niedrige Dichten der Oberflächenzustände gefunden. Es liegen also im untersuchten Energiebereich keine nicht-lokalisierten, sondern nur lokalisierte Zustände vor, deren Dichte von der Herstellung der Oberfläche stark abhängt. Dieses Ergebnis ist in Übereinstimmung mit der theoretischen Voraussage ( 2 3 - 2 4 ) , daß an oxidbedeckten Oberflächen von Germanium und Silizium keine nicht-lokalisierten Zustände auftreten sollten.
6. Schluß Die hier gebracht Übersicht sollte zeigen, inwieweit bisher experimentell gefundene Oberflächenzustände den in der Einteilung gegebenen Gruppen zugeordnet werden können, d. h. inwieweit der Ursprung dieser Zustände schon geklärt ist. Die Ergebnisse zeigen, daß eine Zuordnung der gemessenen Zustände in einigen Fällen qualitativ möglich ist. Es ist zu ttoffen, daß durch weitere Experimente der beschriebenen Art, aber auch durch Berechnungen von Oberflächenzuständen für die experimentell gefundenen Oberflächenstrukturen der Ursprung der Zustände bald noch besser geklärt werden kann. Durch die Klärung des Ursprungs der Oberflächenzustände sollte dann eine Grundlage einer zweidimensionalen Festkörperphysik der Oberfläche gegeben sein, auf der dann weitergehende Eigenschaften wie Transportphänomene, Übergangswahrscheinlichkeiten und andere vielleicht leichter verstanden und erklärt werden können. Für zahlreiche Diskussionen und Anregungen bin ich Herrn Professor Dr. G. Heiland zu großem Dank verpflichtet. Auch den Herren Professor Dr. G. Leibfried, Dr. R. O. Jones und Dr. F. Forstmann möchte ich für hilfreiche Diskussionen danken.
208
Literaturverzeichnis (!)
G. Heiland, Fortschr. Phys. 9, 393 (1961) Bericht.
(2)
A. Marty, Y. Goldstein und N. B. Grover, "Semiconductor Surfaces" (North-Holland Publ. Co. Amsterdam 1965). D. R. Frankl, "Electrical Properties of Semiconductor Surfaces" (Pergamon Press Ltd., Oxford, England, 1967).
(3) (4)
(s)
S. G. Davison und J. D. Levine, "Surface States" in Solid State Physics, Herausg. F. Seitz, D. Turnbull, H. Ehrenreich (Academic Press, New York und London 1970) Band 25. E. Bauer in "Techniques of Metal Research" Vol. 2, Kap. 15 und 16, ed. R. F. Bunshah, Interscience Publishers, New York 1969.
(6) (7) (8) (9) (10)
P. J. Estrup, E. G. McRae, Surf. Sei. 25, 1 (1971). M. Henzler, Surface Sei. 19, 159 (1970). G. W. Gobeli, F. G. Allen, J. Chem. Phys. Solids 14, 23 (1960). M. Henzler, Phys. Status Solidi 19, 833 (1967). h. E. Farnsworth, R. E. Schlier, T. H. George und R. M. Burger J. Appl. Phys. 26, 252 (1955) u n d / . Appl. Phys. 29, 1150(1958).
(n) (12) (13) (14) (15) (>6) (17) (18)
J. J. Lander, Phys. Rev. 91, 1382 (1953). R. E. Weber und W. T. Peria, J. Appl. Phys. 38, 4355 (1967). L. A. Harris, J. Appl. Phys. 39, 1419 (1968). C. C. Chang, Surface Sei. 25, 53 (1971). P. W. Palmberg, G. K. Bohn u n d / . C. Tracy, Appl. Phys. Lett. 15, 254 (1969). A. Bennighoven, Z. Phys. 230, 403 (1970). W. P. Ellis und R. L. Schwoebel, Surface Sei. 11, 82 (1968). M. Henzler, Surface Sei. 22, 12 (1970).
(19) (20)
R. L. Park und J. E. Houston, Surface Sei. 18, 213 (1969), 21, 209 (1970). G. Ertl und J. Küppers, Surface Sei. 21, 61 (1970).
(21) (22)
A. Ignatievs, J. B. Pendry und T. N. Rhodin, Phys. Rev. Lett. 26, 189 (1971). S. B. Duke und C. W. Tucker, J. Vac. Sei. Techn. 8, 5 (1971), M. G. Lagally, T. C. Ngoc und M. B. Webb, private Mitteilung
(23) (24)
R. O. Jones, Phys. Rev. Lett. 20, 992 (1968). V. Heine in "Structure and Chemistry of Solid Surfaces", Herausg. G. A. Somorjai, (Wiley, New York 1969).
(25) (2•
2D
3p 3p
Eine Darstellung der Eigenfunktionen reiner irreduzibler Darstellung als Linearkombinationen von antisymmetrischen Produkten von Ein-Elektronen-Eigenfunktiorien ( 1 S ) liefert für die Störungsenergie Summen von Ein-Elektronenintegralen ( 1 4 ) . Unter Verwendung der Slaterschen Ein-Elektronen-Eigenfunktionen und bei Vernachlässigung aller Effekte zweiter Ordnung ergeben sich daraus folgende Ausdrücke für die Kristallfeldenergien: 0:
A E j ( A , ) = + 0,869 nj (cos 2
AEj(E)
S:
=-0,435nj(cos2^j-|)^3
AEj(A1)=+2,54nj
(cos2^-|)^3
A E j ( E ) = - 1,27 nj ( c o s 2 ^
F:
AEj(A1) = -0,666nj(cos2dj-|)^3
A E j ( E ) = + 0,333 n j (cos 2
Cl:
A E j ( A 1 ) = - 2 , 0 4 n j (cos 2 i?
A E j ( E ) = + 1,02
nj
(cos 2 .?
Dabei ist der Winkel, der von der zwischen der Hauptachse und der kürzesten Verbindung vom chemisorbierten A t o m zum j-ten Nachbarn gebildet wird;
226
nj Rj AE
ist die Anzahl der Elementarladungen des j-ten Nachbarn; ist der Abstand zwischen dem j-ten Nachbarn und dem chemisorbierten Atom; ist in atomaren Energieeinheiten gegeben.
Aus den Ergebnissen folgt weiter, daß N- und H-Atome durch C 4v -Felder im Grundzustand nicht stabilisiert werden. Numerische Werte wurden von Kollrack ( 13 ) für die Adsorption an Kobalt-Oberflächen berechnet und in der Tabelle IV aufgeführt. Tabelle IV: Kristallfeldenergien von chemisorbierten O-, S-, F-, Cl-Atomen für einzelne Co 3+ -Nachbarn (Zahlenangaben in kcal/mol) ( 1 3 )
O
C1
iSj = 0
AEjiAi) AEj (E)
R
Rjcoval
-19,4 -32,0 -62,7
tfj = 90°
O AEjiAj) AEj(E)
S AEjCAj) AEj(E)
F AEjiAj) AEj(E)
+ 9,7 +16,0 +31,4
+15,4 +25,6 +50,3
- 7,9 -13,2 -25,2
Rjv.d.W.
j
Rj.v.d.w. R j Rjcoval
+ 9,7 +16,0 +31,4
- 4,8 - 8,0 -15,7
AEj(Ai) AEj(E) -30,8 -51,1 -100,6
+15,5 +25,6 +50,3
- 7,7 -12,8 -25,2
AEj(Ai) AEj(E)
AEj(Ai) AEj (E)
+15,8 +26,3 +50,3
+26,4 +44,2 +89,0
- 7,9 -13,2 -25,2
+ 4,0 + 6,6 +12,6
-13,2 -22,1 -44,5
C1 AEj(Ai) AEj (E) -13,2 -22,1 -44,5
+ 6,6 +11,0 +22,2
Rj ist die Summe der Ionenradien von Oberflächen- und Chemisorbiertem Atom
Abhängig von der Entfernung erreicht die Kristallfeldenergie die Werte der Dissoziationsenergie der betrachteten zweiatomigen Moleküle. Dies deutet darauf hin, daß die Kristallfeldenergie dafür verantwortlich ist, daß zweiatomige Moleküle wie 0 2 , S2, F 2 , Cl2 als Atome chemisorbiert werden. N2 zeigt andererseits keine Kristallfeldbeeinflussung und wird selten auf Übergangsmetallen adsorbiert und wenn, dann als Molekül und nicht als Atom ( 1 6 ' 1 7 ). Die hohe Krfttallfeldenergie von chemisorbierten Schwefelatomen führt zu der bekannten hohen Chemisorptionsbindung des Schwefels. Die elektrostatische Fernwirkung der Oberfläche führt zum ersten Schritt der Annäherung zwischen Gasmolekül und Festkörperoberfläche und bestimmt bei den nicht chemisorbierenden Molekülen, wie N 2 , H 2 auch deren Desorptionsenergie wie Untersuchungen von De Boer ( 1S ) zeigen. Für Moleküle, die im Kristallfeld aufspalten, überwiegt nach der Annäherung der Anteil der kovalenten Kristallfeldwechselwirkung. Im Anschluß an die Chemisorption beginnt ein Ionosorptionsvorgang, der im wesentlichen dem Mott Cabreraschen ( 19 ) Reaktionsmechanismus folgt (Fig. 4): Durch kovalente Bindungen festgehalten, sitzt das Gasatom an der Oberfläche und verliert durch Tunneleffekte ein Valenzelektron an das Metall. 227
Oxid
Sauerstoff
Melali
Elektronenniveau
Oxid
Sauerstoff
Fig. 4 Ionosorptionsvorgang an einer chemisoibierten Oberflächenschicht.
M' Eleklronenniveau
Dadurch entsteht über die erste Chemisorptionsschicht hinweg ein beträchtliches, die Diffusion der Metallionen nach außen anregendes Feld der Größenordnung 10 7 . . . 10® V/cm. Die Ionosorption beschränkt damit zweidimensionale Überstrukturen auf extrem geringe Bedeckungen. Zusammengefaßt beschreibt das Modell also folgende Eigenschaften: 1. Die Abnahme der kovalenten Bindungsstärke kann als virtuelle Kraft auf die Oberflächennetzebene angesehen werden. Als Produkt mit der mittleren quadratischen Verschiebung der Netzebenenatome läßt sich daraus die Gitterstörung im Oberflächenbereich berechnen. 2. Die durch die Gitterstörung hervorgerufenen elektrostatischen Ladungsverschiebungen rufen die fernwirkenden Oberflächeneigenschaften hervor. 3. Bei Adsorptionsvorgängen treten zunächst Polarisationswechselwirkungen in Erscheinung, die zu einer Annäherung zwischen Gasmolekül und Oberfläche führen. Danach jedoch setzen die kovalenten, kurzreichweitigen Bindungen ein und führen zu festen Chemisorptionsbindungen. 4. Da durch die chemisorbierten Gasatome die kovalenten Bindungszustände der Oberflächenatome wieder aufgefüllt werden, gehen die Gitterdehnungen des Grundgitters bei diesem Prozeß wieder zurück. Bei starker Chemisorptionsbindung kann dieser Vorgang zur Einstellung des normalen Grundgitterabstandes führen. 5. Bei weiterer Adsorption an diesen Oberflächen treten Ionosorptions- und Diffusionsprozesse auf. 6. Der Charakter einer Oberfläche wird in ihrer engsten Umgebung durch quantenmechanische Wechselwirkungskräfte bestimmt. Ihre asymptotische Fernwirkung erfolgt durch klassische elektrostatische Kräfte. Im folgenden sollen nun einige Meßergebnisse mit diesem Modell verglichen werden. Fig. 5 stellt ein typisches Sekundärelektronenspektrum dar. 228
c
O) .«I £
100
Fig. 6.
1.000
10.000
100.000
Energie in [«HHHÜ »l'.BI m i m ISSäSS
0
b)
Oberfläche
100
nach
200 Volt
CO-Begasung
1-10'1 Torr/min
Intensitätsmessungen von Onchi und Famsworth ( 4 0 ) an Nickeleinkristallen zeigen, daß die Verbreiterung der Intensitätsmaxima in den Intensitätsverläufen gereinigter Oberflächen durch zusätzliche Maxima hervorgerufen werden, die sich mit zunehmender Bedeckung weiter an die Bragg-Maxima heranschieben (Fig. 7). Nach/. Langeheine ( 4 2 ) führen dynamische Berechnungen des Intensitätsverlaufes bei Gitteraufweitungen ebenfalls auf zusätzliche Maxima im Intensitätsverlauf mit gleichen Eigenschaften bei abnehmender Gitteraufweitung. Die Aussage des Modellbildes über Gitteraufweitungen an Oberflächen wird durch diese Untersuchungen bestätigt. Bei den Untersuchungen der Adsorptions- und Chemisorptionsvorgängen ist das Augerspektrometer ein unentbehrliches Hilfsmittel. Im Gegensatz zu LEED-Untersuchungen verwendet man bei der Augerspektroskopie höher energetische Primärelektronen und kann damit die Anregung einer großen Anzahl von Augerübergängen der Adsorptions- und Unterlagematerialien durchfuhren. Untersuchungen von Weber und Peria ( 43 ) zeigen, daß der weitaus größte Teil der Augerelektronen aus der ersten Atomlage stammt. Das Augerspektrometer weist damit eine ausgezeichnete Genauigkeit bei der Analyse von Oberflächenbedeckungen auf. Desorptionsmessungen vonM Seidl (35), T. Maday, J. Yates ( 4 4 ) sowie D. Menzel und Gomer ( 4 S ) zeigen jedoch, daß bei Adsorptionsund Chemisorptionsprozessen an Metalloberflächen der Einfluß des Elektronenstrahls nicht vernachlässigt werden darf. Durch ihn können Adsorptionsprozesse aktiviert aber auch Desorptionsvorgänge eingeleitet werden. 231
Die bisherigen Untersuchungen zeigen, daß nur sehr fest gebundene Adsorptionsschichten mit Bindungsenergien, die größer als 40 . . . 50 kcal/mol sind, während eines längeren Elektronenbeschusses nicht gestört werden. Kombinierte Untersuchungen der Sauerstoffadsorption an einkristallinen, sehr reinen und ebenen Kupferoberflächen zeigen ( 3 5 ) Umwandlungen von LEED-Überstrukturen bei Sauerstoffzugabe, jedoch keine Änderung der Intensitäten der betreffenden Augerübergänge. Diese Beobachtung deutet auf eine Eindiffusion des Sauerstoffs und auf die Ausbildung dreidimensionaler Metall-Sauerstoff-Anordnungen im Oberflächenbereich Auch dieses Ergebnis bestätigt die modellmäßige Vorhersage. Melmed, Layer und Kruger ( 4 6 ) führten vergleichende Untersuchungen zwischen der Feldelektronenmikroskopie und der Beugung langsamer Elektronen aus. Die Ergebnisse, die in Fig. 8 wiedergegeben sind, zeigen, daß vor dem Auftreten von Uberstrukturreflexen im LEED-Bild schon eine starke Reaktion auf der WolframOberfläche stattfindet, die durch das Feldelektronenbild angezeigt wird. Untersuchungen über den erforderlichen Restgasdruck für die Ausbildung von Überstrukturen von T. M. French, A. E. Morgan und G. A. Smorjay ( 4 7 ) zeigen, daß zur Ausbildung von Chemisorptionsstrukturen ein relativ hoher Gasdruck erforderlich ist.
Reine
Oberfläche
2a
Fig. 8
Sauerstoffbegasung
3a
3b
Aufheizen 232
1,2-10
auf
'9-
1000 °C
k
Torr/s
R
a #
Vergleich zwischen LEEDund Feldelektronenmikroskopischen Untersuchungen an Wolfram la, b) reine Oberfläche 2a, b) Begasung 1,2 • 1CT4 Torr/s 3a, b) Ausbildung von Überstrukturen im Beugungsbild durch Aufheizen auf 1000°C
Es ist sicher, daß Gas, welches im Volumen des Kristalls gelöst ist, eine wichtige Rolle bei Oberflächenreaktionen spielt ( 4 S ). Die Bildung gewisser Oberflächenstrukturen, speziell bei der Oxydation, erfordert die Gegenwart von Atomen, die unter die Oberfläche diffundiert sind. Beide, die Löslichkeit und die Diffusionsrate von Gasen in Festkörpern steigen jedoch mit wachsendem Gasdruck. Damit deuten die Beobachtungen ( 4 6 ) auf ein Eindringen adsorbierter Gasatome bei der Ausbildung von Überstrukturen. Ellipsometrische sowie LEED-Untersuchungen von Sauerstoff-Adsorption auf Wolfram durch Carroll und Mehned ( 4 9 ) deuten auf den folgenden von Germer und May ( s o ) gleichfalls angenommenen Adsorptionsprozeß (Fig. 9). Für die Entstehung von LEED-Überstrukturen scheint auch hier ein geordnetes Wolfram-Sauerstoff-Raumgitter verantwortlich zu sein. Diese Ergebnisse bestätigen die Modellauffassung, nach der die Chemisorption auf der Oberfläche nur ein instabiler Zwischenprozeß ist und der Mott Cabrerasche ( 19 ) Reaktionsmechanismus schnell zu Ionosorptionsprozessen führt. Adsorptions- und Desorptionsuntersuchungen von Gasen an Kupferoberflächen, die mit Hilfe einer UHV-Mikrowaage vor kurzem ausgeführt wurden ( S 1 ), zeigten überraschend große Adsorptionsraten, die nur durch Volumendiffusion zu verstehen sind. Das hier behandelte Modell bezog sich weitgehend auf gitterdynamische Aspekte der Grenzflächenphysik und -chemie.
Fig. 9 Der von Carroll und Melmed vorgeschlagene Mechanismus der Sauerstoffadsorption auf eine (Oll)-W-Oberfläche.
233
Unter diesen mehr thermodynamischen Gesichtspunkten, bei denen Experimente und modellmäßige Vorhersage weitgehend übereinstimmen, ist man heute in der Lage, die Oberflächeneigenschaften aus dem Gitteraufbau heraus zu verstehen. Weitere Untersuchungen müssen zeigen, inwieweit dieser Prozeß auch auf andere Problemkreise wie Bandstruktureinflüsse und Oberflächenzuständc anwendbar ist.
Literaturverzeichnis
C
(10)
(19
C20)
A. U. Mac Rae und L. H. Germer, Phys. Rev. Letters 8, 489 (1962). R. W. James, The Optical Principles of the Diffraction of X-Rays. G. Bell and Sons Ltd., London 1958. M. Rich, Phys. Letters 4, 153 (1963). B. C. Clark, R. Herman und R. F. Wallis, Phys. Rev. 139, A 860 (1965). R. F. Wallis, B. C. Clark und R. Herman, Phys. Rev. 167, 652 (1968). J. Langeheine, Zeitschrift für Naturforschung 23a, 1510 (1968). G. C. Bond, Bull Soc. Chim. Belg 67, 371 (1958). G. C. Bond, Platinum Metal Rev. 10, 87 (1966). G. C. Bond, Discussions Faraday Soc. 41, 200 (1966). D. A. Dowden, Bull Soc. Chim. Belg 67, 463 (1958). K. B. Pickup und B. M. W. Trepnell, J. Chim. Phys. 25, 182 (1956). Z. Knor und E. W. Müller, Surf. Sei. 10, 21 (1968). R. Kollrack, J. Catalysis 14, 332 (1969). E. U. Condon und G. H. Shokley, The Theory of Atomic Spectra, Cambridge University Press, London 1953. R. Kollrack, J. Catalysis 12, 321 (1968). G. C. Bond, Catalysis by Metals. Academic Press, Inc. New York 1962. S. Z. Rogniskii, Scientific Selection of Catalysis. S. Monson, Jerusalem 1968. J. H. De Boer, Advances in Catalysis 8, 17 (1956). N. Cabrera und A^. F. Mott, Rep. Progress Phys. 12, 163 (1948). /. /. Quinn, Phys. Rev. 126, 1435 (1962). Klemperer, O. und/. P. G. Shepherd, Adv. Phys. 12 (1963). /. J. Lander und J. Morrison, J. Appl. Phys. 34, 3517 (1963). J. J. Lander und J. Morrison, J. Appl. Phys. 35, 3593 (1964). G. Gafner, Surface Sei 2, 534 (1964). R. L. Gerlach und T. N. Rhodin, Surface Sei 8, 1 (1967). A. Sommerfeld und H. Bethe, Handbuch der Physik, Vol. 24/2 (Springer-Verlag, Berlin, 1933) p. 486. C. J. Davisson und L. H. Germer, Proc. Natl. Acad. Sei US 14, 619 (1928). E. G. McRae und C. W. Caldwell, Surface Sei 2, 509 (1964).
234
c 29 ) (30) (31) (32) (33) C34) (35) (36) (37) (38) (39) O C41) i42) (43) O (4S)
E. G. McRae und C. W. Caldwell, Surface Sei 7, 41 (1967). E. G. McRae, J. Chem. Phys. 45, 3258 (1966). E. G. McRae, Surface Sei 8, 426 (1967). D. S. Boudreaux und V. Heine, Surface Sei 8, 14 (1967). G. Capart, Surface Sei 13, 36 (1969). P. M. Marcus und D. W. Jepsen, Phys. Rev. Letters 20, 925 (1968). M. Seidl, Veröffentlichung folgt. J. W. May und L. H. Germer, J. Chem. Phys. 44, 2895 (1966). N. J. Taylor, Surface Sei 4, 161 (1966). A. G. Jackson undAi. P. Hooker, Surface Sei 6, 297 (1967). P. J. Estrup und J. Anderson, Surface Sei 8, 101 (1967). M. OnchiundH. E. Fansworth,-Surface Sei 11, 203 (1968). F.Jona, Surface Sei 8, 478 (1967). J. Langeheine, Verhandlungen der Physikalischen Gesellschaft, März 1970. R. E. Weber und W. T. Peria, J. Appl. Phys. 38, 4355 (1967). T. E. Maday und J. T. Yates, Surface Sei 11, 327 (1968). D. Menzel und R. Gomer, J. Chem. Physics 41, 3311 und 3329 (1964).
C6) ( 7) O O (50) (51)
A. J. Melmed, H. P. Layer und J. Kruger, Surface Sei 9, 476 (1968). T. M. French, A. E. Morgan und G. A. Smorjay, Surface Sei 22, 486 (1970). G. E. Moere und F. C. Unterwald, J. Chem. Phys. 48, 5409 (1968). J. J. Carroll und A. J. Melmed, Surface Sei 16, 251 (1969). L. H. Germer und W. May, Surface Sei 4, 452 (1966). J. Langeheine, Berichte der Bunsengesellschaft 1971.
235
Festkorperprobleme XI (1971)
Results of Elastic and Inelastic Electron Tunneling Through Potential Barriers in Solids
Karl Heinz Gundlach Max-Planck-Institut für Physik und Astrophysik, Institut für Astrophysik, Abteilung Numerische Rechenmaschinen, München
Summary: This article reports on experimental results published in the previous 3 - 4 years. The scope of the survey can be seen from the table of contents. The article is divided into two main parts: elastic - and inelastic tunneling. Elastic tunneling allows in some cases the determination of physical parameters of tunnel junctions. To do this, the current J of the junction is usually measured as a function of applied voltage V and/or temperature T. Then the J (V, T) characteristics may be used either directly or through intermediate quantities such as d/dV (In J) and similar expressions. In this way one can determine for example the metal-insulator barrier height and the electron dispersion relation in the tunnel barrier. Naturally, the parameters so obtained should also be measured independently by other methods. In the past this has not always been done. Inelastic processes arise if tunneling electrons excite an oscillator, e. g. a phonon mode, within or near the tunnel barrier. In these experiments, the second derivative d 2 J/dV 2 is measured as a function of applied voltage. One obtains structures in d 2 J / d V 2 at voltages which correspond to the frequencies of the oscillators. The structures appearing in d 2 J/dV 2 have usually been identified by comparison with other independent measurements, e. g. with the infrared absorption spectrum of the material forming the tunnel barrier.
Zusammenfassung: Experimentelle Ergebnisse der letzten 3 - 4 Jahre werden berichtet. Das Inhaltsverzeichnis gibt einen Überblick über die besprochenen Themen. Der Artikel ist in zwei Hauptgebiete unterteilt: elastische - und inelastische Tunnelprozesse. Elastisches Tunneln erlaubt in einigen Fällen physikalische Parameter der Tunnelstrukturen zu bestimmen. Dazu wird der Strom J der Tunnelstruktur als Funktion der Spannung V und/oder der Temperatur T gemessen. Aus den J (V, T) Charakteristiken direkt, oder durch Bildung geeigneter Ausdrücke wie d/dV (In J) und ähnlicher Größen, lassen sich Informationen gewinnen. So kann beispielsweise die Austrittsarbeit Metall-Isolator und die Dispersionsbeziehung der Elektronen in der Tunnelbarriere gemessen werden. Natürlich ist es wünschenswert, die auf diese Weise gewonnenen Parameter unabhängig auch mit anderen Meßmethoden zu bestimmen. Das ist bisher nicht immer geschehen. Inelastische Prozesse treten auf, wenn die tunnelnden Elektronen einen Oszillator, zum Beispiel eine Gitterschwingung, innerhalb oder in der Nähe der Tunnelbarriere anregen. In diesen Experimenten wird die zweite Ableitung d 2 J / d V 2 als Funktion der Spannung V gemessen. Man erhält in der zweiten Ableitung Strukturen bei Spannungswerten, die den Schwingungsfrequenzen der Oszillatoren entsprechen. Die Strukturen in der zweiten Ableitung werden gewöhnlich durch Vergleich mit anderen unabhängigen Messungen identifiziert; zum Beispiel mit dem Infrarot-Absorptionsspektrum des gleichen Materials, das die Tunnelbarriere bildet.
237
1. Introduction Electron tunneling through thin insulators separating two conducting regions has been the object of considerable experimental and theoretical study in recent years. Fig. 1 shows the electron energy diagram of a Metal 1 -Insulator-Metal 2 sandwich film without a voltage bias. When a voltage is applied, as shown in Fig. 2, a tunnel current can flow from one metal to the other through the forbidden band of the insulator. If the electron undergoes the transition between the two metal electrodes at constant energy, the process is called elastic tunneling. Inelastic tunneling is characterized by the fact that the electron loses energy in the tunneling barrier region or in the electrodes near the metal-insulator boundaries. The first part of this paper is devoted to elastic tunneling and the second part to inelastic tunneling. The paper will emphasize experimental results. Sometimes, however, a brief account of theoretical work will be presented. We will not be discussing effects which arise when one or both electrodes are permitted to become superconducting.
Fig. 1 Schematic electron energy diagram for an asymmetric Metal 1-Insulator-Metal 2 sandwich film without a voltage bias. Wi and W 2 are the work functions of metal 1 and metal 2, respectively, x is the electron affinity of the insulator. t and 2 = ). Then the procedure applied by Mead and Lewicki is as follows, a) Low voltages (qV < < 4>) • In this case the tunnel current is approximately linear with applied voltage, and reads: J s A • ^ • exp [ - 2 • s • I k x (V = 0)1 ].
(2.4.1)
Eq. (2.4.1) follows from eq. (2.1.1) as has been shown by Stratton, Lewicki and Mead ( 4 3 ). The term A does not depend on s and V. k x (V = 0) is the electron wave number normal to the film plane encountered in the tunneling path for V = 0. In the case V = 0 the electron energy E' is equal to 4> where E' is measured from the bottom of the insulator conduction band. The situation is illustrated in Fig. 10. insulator conduction
Fig. 10. Energy diagram of a symmetric M-I-M sandwich structure used to describe the determination of the energy momentum relationship in the insulator forbidden band gap.
247
Denoting with R and C the sample resistance and capacitance, respectively, then it follows from eq. (2.4.1) that l n R ' C s l n ^ - 5 + 2 • lk x (V = 0) I s. A
(2.4.2)
The term Cs/A does not depend on s because C 1/s. Thus from the slope of the plot In (RC) versus film thickness s, the wave number k x at V = 0, that is at E' = EF.AE
T
1
rr (•2-EF»qV)
1— Ae 1 i t
t V
m
w
v
1 •,
- —
AE
m
/«.v
t r
(c)
(d)
Fig. 14. Energy diagrams of an Al-Al 2 0 3 -SnTe (GeTe) tunnel junction for various voltage biases.
The negative resistance regions are closely related to the band structure of the semiconductor and may be explained along the electron energy diagrams of Fig. 14a-14d. Fig. 14a shows the energy diagram of the metal-insulator-semiconductor junction without a voltage bias. Fig. 14b 0 = qV^EF In this voltage range the electrons tunnel from the metal electrode into the empty states lying between the Fermi level and the top of the valence band of the semiconductor. We are using the trapezoidal potential barrier model and parabolic energy momentum relation in the insulator forbidden band. Then the WKB transmission probability, for electrons at the metal Fermi level, having zero transverse momenta, may be evaluated from eq. (2.1.2) to give D = exp
4 \f2~mi 4 > 2 / 2 - q V ) 3 / 2 - - •s 3 h qV-4>! +2
-
O s q V s E f -(2.5.1) 251
According to eq. (2.5.1) the transmission probability, and hence the tunneling current, increases with increasing voltage subject to the condition 0 = q V s E F . Fig. 14c E F + AE s qV 2 E F . In this voltage range only electrons in energy levels between A and B of the metal electrode can contribute to the tunnel current. Electrons in the levels between A and the metal Fermi level FL face the energy gap of the semiconductor and hence cannot tunnel because there are no available states there. The transmission probability of electrons entering the semiconductor just below the top of the valence band may be written, according to eq. (2.5.1), as follows Dc = exp
4 3
V 2 N^
(! + $2
Ef + AEaqVi=EF
(2.5.2)
Eq. (2.5.2) states that the transmission probability now decreases with increasing voltage. The physical origin of this effect is the increase of the metal-insulator energy barrier with increasing voltage foF-electrons entering the semiconductor between the Fermi level and the top of the valence band of the semiconductor. It has been shown by Esaki, Stiles and Chang ( 35 > 48 ), by evaluating the tunnel current, that the decrease of the transmission probability leads, as expected, to the negative resistance observed experimentally. Fig. 14d qV > AE + E F . In this voltage region eq. (2.5.2) is still valid. Now we have, however, also the transmission probability of electrons entering the semiconductor in the energy range between the metal Fermi level and the bottom of the semiconductor conduction band, i.e. between A' and B' in Fig. 14d. The transmission probability for electrons at the metal Fermi level is given by eq. (2.5.1). The transmission probability D of eq. (2.5.1) increases with increasing voltage and takes much higher values than the transmission probability D c of eq. (2.5.2). Since the total current is essential proportional to D c + D, and since D increases much more rapidly than D c decreases, the tunnel current increases with increasing voltage when q V > EP + AE. In view of the above considerations and by inspection of Fig. 13 it can be seen that E f s 0,6 eV and the energy gap of SnTe is AE = 0,3 eV.
2.6. Resonance Tunneling via Trap States Up till now we have considered the tunnel effect through a virtually perfect insulator. Naturally, an insulator can contain a large number of imperfections. Recently electron tunneling, involving resonance states due to localized traps in the potential barrier, has been investigated both experimentally ( 5 0 » s l ) and theoretically ( s l ~ 5 6 ). Provided the trap density is sufficiently small the so-called two-step tunneling process with a resonance state as an intermediate state can 252
Fig. 15. Schematic energy diagram for an M-I-M sandwich film with trap states in the barrier region, (a) Zero bias voltage, (b) a voltage is applied such that the resonance channel for the trap level with the energy E 2 is just opened. The threshold voltage for l s the two-step resonance process is given by V; = — (4> - E;) — (i = 1, 2, 3 . . . ).
occur. We would like to consider the two-step process first in M-I-M junctions. The situation is illustrated in Fig. 15. Trap levels in the barrier region are shown. It is assumed that their energies E, lie above the zero bias Fermi level. When a voltage is applied the trap levels shift downwards and if the energy of a trap level is near the Fermi level of the negatively biased electrode a tunneling channel for the two-step process is opened. Electrons near the Fermi level of electrode 1 can tunnel to the trap state and then from the trap state to the electrode 2. In Fig. 15b the threshold voltage for the opening of a new tunneling channel is 1 s given by V, = - (4> - E,) — . We note that the threshold voltage depends on the x 4
i
direction of voltage bias if x ; # s/2. For the positively biased left hand metal of Fig. 15a the threshold voltage reads V = Vj
x
s
i
_ x . • The opening of a new tunneling
channel gives rise to an enhancement of the current, consequently to a change in the conductance a and to peaks in d a/dV near the threshold voltage. This is shown schematically in Fig. 16. The situation is somewhat similar to that of inelastic tunneling where the excitation of a vibrational state of an impurity introduces a new tunneling channel. This will be described in section 3.1. Experimental Observations Esaki, Stiles and Chang ( 5 0 ) reported that they observed an atomlike spectrum plotting the conductance of an Al-Al203-PbTe junction as a function of voltage. Their result is shown in Fig. 17. The spikes in the conductance curve are attributed to localized energy levels in the forbidden band of PbTe. The energy diagram of the junction for zero voltage bias is shown in the insert of Fig. 17. When a voltage is applied (metal negative) and the energy of the metal Fermi level is equal to one of the localized states in PbTe, the conductance shows a peak. It seems, however, 253
(c)
Fig. 16 Schematic single impurity conductance quantities, (a) Impurity conductance ratio versus voltage, (b) Total junction conductance versus voltage, (c) Derivative of total conductance versus voltage (from Gadzuk (53)).
Fig. 17. Tunneling conductance versus applied voltage at 1.3 °K for PbTe-Al 2 0 3 -metal junction illustrating the general shape and the structure, S, P, and D. The far-left-hand curve was plotted with the conductance level off-set by 2.1 X 1CT5 • The insert shows schematically an energy diagram of the junction at zero bias, including the energy levels of a deep center in PbTe (from Esaki, Stiles and Chang (50)).
that Esaki's, Stiles', and Chang's interpretation of their results is not commonly accepted ( s 3 ) . Also the authors do not give an analysis of the conductance curve in Fig. 17. Parker and Mead ( 5 1 ) have investigated Schottky barriers in palladium-CdTe contacts. Different carrier concentrations of the n-type CdTe have been used. The I-V characteristics of these contacts are shown in Fig. 18. The authors have reported that the upper portions of the curves agree reasonably well with that expected from tunneling calculations. On the other hand, the slope of the lower portions of the In J versus V curves are smaller than expected theoretically by a factor of two. The lower portions of the curves are attributed to resonance tunneling via intermediate states as illustrated in Fig. 19. The electrons tunnel from the semiconductor to the
Fig. 18 I-V characteristics of Pd " n " CdTe barriers for several carrier concentrations (J 0 = 1 A/cm 2 ) ( 5 1 >
•semiconductor
(a)
(b)
(c)
Fig. 19. Electron energy diagrams of a Schottky barrier, (a) without a voltage bias, (b) and (c) with voltage biases in forward direction. The figures illustrate the possibility of resonance tunneling in a certain voltage range if trapping centers are available in the barrier region.
255
resonance states and then from the resonance states to the metal. In the higher voltage region of the InJ versus V curves the resonance states are below the semiconductor conduction band and hence only single step tunneling can occur. The change of the slope of the In J versus V curves is then explained as follows. The WKB transmission probability of the single-step process for a Schottky barrier in forward bias direction (cf. Fig. 19) is given by ( 5 1 ) |
D = exp
v ^ M x
= exp
- const. (-V-7j)
(2.6.1)
The transmission probability of the two-step process, as will be shown later, is approximately proportional to the square root of the transmission probability (2.6.1). Thus the two slopes of the In J versus V curves differ by a factor of two as observed experimentally. The nature of the impurity states in the two experiments described above was not identified. Because resonance tunneling might become a useful tool to investigate trap states in the barrier region we now discuss methods of evaluating the two-step resonance current. Evaluation of the two-step Resonance Tunnel Current We first recapitulate briefly the analysis used by Parker and Mead ( 51 ) and extend it to finite temperatures. Then a more refined treatment for the problem at hand will be offered by making use of perturbation theory ( S 6 ). Following Parker and Mead, the tunneling rates from the conducting region 1 to the resonance state and from the resonance state to the conducting region 2 (cf. Fig. 15b or Fig. 19b) are given respectively by Ri = c • Dj • f! • (1 - F) - c • Di • (1 - fi )• F
(2.6.2)
R 2 =c D2- (1 - f 2 ) - F - c
(2.6.3)
and D2- f 2 - (1 - F )
Here c is an unspecified, slowly varying function of voltage and electron energy. Di and D 2 are the transmission probabilities for electrons tunneling from the conducting region on the left hand side to the trap state, and from the trap state to the conduction region on the right hand side, respectively. Using WKB approximation we have D! =exp
'
and
k 2X dx
(2.6.4)
s
D2 = exp 256
F o
- 2
i^1
dx
(2.6.5)
(r 2 — r!) is the effective width of the hole cut out of the barrier by the trap, f; and f 2 in eqs. (2.6.2) and (2.6.3) are the Fermi-Dirac distributions of the conducting region 1 and 2, respectively. F is the probability that the resonance state is occupied. Under steady state conditions F will adjust itself until Ri=R2=R.
(2.6.6)
Inserting eqs. (2.6.2) and (2.6.3) into eq. (2.6.6) yields for the resonance tunneling rate R
-c-§rn5;--
(26
-7)
The tunnel current through a single resonance state is proportional to R. The interesting feature of eq. (2.6.7) is that D! • D2 / (Di + D 2 )attains its maximum value when Di = D 2 . The maximum is very pronounced. Hence resonance states whose local position is such that Di = D 2 contribute predominantly to the two step tunnel current. Furthermore, making use of eqs. (2.6.4) and (2.6.5), it can be seen that the maximum value of D t • D 2 / (Di + D 2 ) is approximately proportional to the square root of the single step transmission probability given by eq. (2.6.1). This was mentioned in the above discussion of Parker and Mead's ( 5 1 ) experimental results. Finally, we note that the case = D 2 corresponds to the so-called size resonance of a symmetric (one dimensional) double barrier as described e.g. by Hrach (ss). It is interesting to see how eq. (2.6.7) stands in relation to the resonance tunnel current equation which will now be derived using perturbation theory ( 5 6 ). The following procedure also allows the evaluation of the resonance tunnel current when an angular momentum is involved in the resonance state. Furthermore, the effect of the life time broadening of the resonance state on the current can be studied. We start with the tunneling matrix element T derived by Gadzuk ( 5 7 ) for resonance tunneling of field emitted electrons from metals upon which atoms are absorbed: T = < m t IVp Im 2 > + < " i ' V F l u
R
>
^
As pointed out by Gadzuk ( S 7 ) eq. (2.6.8) is the usual type of matrix element describing a resonance process. In our case I m t > and I m 2 > are the eigenfunctions of the conducting region 1 and 2, respectively. V F is the potential of the applied field and I u R > is the eigenfunction of the resonance intermediate state. Because r» we are dealing with a decaying state the resonance energy (E R + i p is complex. 1"" denotes the life time broadening of the resonance level. To calculate the tunnel current we write the transition probability per unit time for electron transit from region 1 to region 2 as follows ( 7 ) Pi-2 = | r m2 -p2-f, ( i - f 2 ) . (2.6.9) 17 Festkorperprobleme X I
257
p2 is the density of states for fixed kj_ = (k 2 + k 2 ) region 1 to 2 in the energy interval dE reads d
=
1/2
in region 2. The current from
Pi " P1-2 ' dE.
(2.6.10)
Subtracting the current in the reverse direction and multiplying by a factor of 2 for the spin, yields 1 = ^ J d E - ITI2 - p , - p 2 - ( f , - f 2 ) .
(2.6.11)
The next step is to insert ITi 2 obtained from eq. (2.6.8) into eq. (2.6.11). We confine the calculation to the second term on the right hand side of eq. (2.6.8), that is, we do not consider direct tunneling between region 1 and 2, and we neglect the interference between direct and resonance tunneling. Proceeding in this way one obtains from eq. (2.6.8) and (2.6.11) for the resonance tunneling current t Ir
f
= 11
PTP2-
dE
J
l < m
i | V F l u R > l 2 • l < u R | v F i m 2 >l2 ( ( £—• (fi - f 2 ) • (E-ER)2+ir2 (2.6.12)
We now need an expression for the life time broadening r . To this end we are using Fermi's golden rule. It gives the transition probability per unit time (r = h/p ) for electron transit from a resonance state to states of a continuous spectrum. For the problem at hand the electron of the resonance state can tunnel to the states of region 1 as well as to the states of region 2. Thus the total transition probability per unit time is given by ^
[Pi l < m i ¡Vplu R > l 2 + p 2 K m 2 i V F l u R > l 2
=
(2.6.13) The life time broadening T expressed in terms of eq. (2.6.13) reads r =
.
(2-6.14)
Total
From eqs. (2.6.12)—(2.6.14) the resonance current becomes 1 ) _47rq f dE - p r 2 i>l 2| 2] 2 (f, - f-2 )E R ) 2 l R _ IV1F IVpiu iu R > iR2 +> lp2-1 l 2 =
( VR 1 D2. 4n m p 2 I ~~ I
(2.6.17)
'
The transmission probabilities Di and D 2 are given by eqs. (2.6.4) and (2.6.5). The term ( k x ) R denotes the average wave number of the resonance state. Inserting eqs. (2.6.16) and (2.6.17) into eq. (2.6.15) yields • » - i f
dE
1
,
7 (DI + D 2 )
2
DI-D2(f1 -f2)
4 m2 l r 2 -
+
.
_
h4(kx)R2
r i
'
i\
T
•
(2.6.18)
(E - E R ) 2
This is the expression for the resonance tunneling current through a single trap state without an angular momentum. Parker and Mead's equation (2.6.7) for the resonance tunneling current may be obtained from eq. (2.6.18) by making use of an approximation applied recently by Hrach ( 5 4 ). To this end the transmission resonance curve must be sufficiently small, or more exact, the integrand of eq. (2.6.18) must be appreciable only for values of E in a very small interval around E = E R in which Di (E), D 2 (E), f j (E) and f 2 (E) are practically constant. Then eq. (2.6.18) may approximated by IR
P . ( E r ) • P 2 ( E r ) [f t ( E R ) ~ f 2 ( E r ) ] =4 f dE 7Th J 1 4 m 2 lr 2 - r 1! '2 l iRR))]r2u + 4 |L>, [ D I (£,R)+L>2 ( E R ) + D 2 (( E + „ / 1_7 • (E - ER)2. 2 4 h (kx) R (2.6.19)
Carrying out the integration over E we obtain T
_ h • q • (kx)R
- m - l r
2
-
r i
l
'
Di ( E R ) • P 2 ( E R ) D L
(E
R
)
+
D2(ER)
"[FL
( E R ) - F 2
( E R ) ]
•
( 2
-
6 2 0 )
It is obvious that eqs. (2.6.20) and (2.6.7) are, except for the less important initial factor, the same although they are derived by using quite different methods. Our use of the perturbation theory shows, however, (a) under which conditions eq. (2.6.7) can be applied, (b) permits the study of the line width of the resonance 259
state (see eq. (2.6.12)), (c) allows the extention of the calculation of the current to cases where the resonance state has a finite angular momentum and to cases where not only a single resonance level of a trap is involved in the transition, and, finally, (d) reveals the neglection of the interference term in eq. (2.6.7) between direct and resonance tunneling. 3. Inelastic Tunneling So far we have considered results where the electron energy is conserved during the tunneling transition. Such processes are called elastic tunneling. The following part of our review is devoted to inelastic interaction between tunneling electrons and (1) molecular impurities in the insulating film, (2) plasmons, (3) phonons, and (4) gold impurities on the n side of a GaAs Esaki tunnel diode. We recall from section 1 that in the inelastic tunneling process the electron loses energy h coo to excitation of an oscillator. The situation is illustrated schematically in Fig. 20. There it is seen that, in the low temperature limit, the inelastic process is not possible for qV < h w 0 , because there are no available states in metal 2 for electrons losing energy ii GO 0 - Thus the inelastic tunneling channel is opened nearly abruptly at qV = ± h to 0 giving rise to a linear increase in the magnitude of the current, symmetric step function increases in the conductance of the junction and antisymmetric peaks in the second derivative of the current. 1 ) This is demonstrated schematically in Fig. 21. The situation is similar to that of resonance tunneling. In the latter case, however, the peak positions in the second derivative depend, as shown in section 2.6., generally on the direction of the applied voltage.
Fig. 20. The left hand figure shows elastic tunneling (a) between metal 1 and metal 2. Inelastic tunneling with excitation energy f b j 0 < q V is not possible because unoccupied states in metal 2 are not available for electrons loosing energy of hu) 0 - The right hand figure is for qV > h o j 0 - Here both elastic (a) and inelastic (b) tunneling is possible. In the latter case the electron loses energy h u o to excitation of an oscillator in the barrier region. !) This is a result of first Born approximation. Second order terms of the Born approximation can give rise to logarithmic singularities and step function decreases at qV = ± h CJQ(65' 6 6 ) •
260
1
: arbitrary units
total current elastic current
, i n e l a s t i c current
-qV
qV
a: dV
qv d'a dV! Tiu>„
qV
Fig. 21 The upper plots illustrate schematically the J-V characteristics for elastic and inelastic tunneling. The resulting steps in the conductance are shown in the middle and the peaks ind 2 I/dV 2 a t q V = ± h w 0 are shown in the lower part of the figure. The dashed curves represent the effects of thermal smearing. The antisymmetric peaks in d 2 I/dV 2 are characteristic of inelastic tunneling processes.
3.1. Inelastic Tunneling via the Vibronic Excitation of Molecular Impurities The first detection of molecular vibration spectra by inelastic electron tunneling was made by Jaklevic and Lambe (S9> 60 ). Further experimental studies have been carried out by Thompson (61), Geiger, Chandrasekhar and Adler ( 6 2 ). The junction used were mostly the usual Al-Al203-metal sandwich films. However, during the growth of the oxide, or after its formation, the sample was exposed to the vapor of the desired impurity. Then the top electrode was evaporated. The impurities were hydrocarbons. It is estimated that the coverage of this organic impurity, when deposited after the formation of the oxide layer, was of the order of one monolayer ( s 9 ) . Examples of experimental results are shown in Figs. 22 and 23. The locations of the maxima in d 2 1/dV 2 correspond to the excitation energies of bending and stretching modes of the absorbed molecules. The vibrational modes appearing in the tunneling spectra can be identified by comparison with the infrared absorption spectrum of a bulk sample of the absorbed molecules. We note that junctions fabricated without any intentional addition of molecular impurities show peaks due to OH bending and stretching modes (cf. Fig. 22, curve A). 261
Fig. 22 Recorder traces of d 2 I / d V 2 versus applied voltage for three A l - A l oxide-Pb junctions taken at 4.2 °K. The zero of the vertical scale is shifted for each curve, and all three are normalized to the same arbitrary units. The largest peaks represent increases of 1 % G 1 ). Also indicated are intervals associated with the energy of IR-active molecular vibrational modes. Curve A is obtained from a "clean" junction. Curves B and C are obtained from junctions exposed to propionic acid CH 3 (CH 2 )COOH and acetic acid (CH 3 COOH), respectively. The peak positions are independent of voltage polarity (after Lambe and Jaklevic (59)).
t
djl dv 2
0
.1
.2
.3
.4
.5
V (VOLTS ) — Fig. 23. Tunneling spectra of cyanoacetic acid CNCOOH. Although similar to the other acids, this spectrum has the C = N stretching line at 280 mV (after Lambe and Jaklevic (60)).
i) G = dJ/dV.
262
We would like to list further observations made in connection with the study of inelastic tunneling due to organic impurities: The gaseous anodization technique described by Miles and Smith ( 6 3 ) was used mostly to grow the oxide layer. This was done because such oxide layers contain very few undesired impurities ( 62 ). In Al-Al- oxide-Pb junctions, however, OH impurities are always observed, independently of sample preparation technique. It seems to be very difficult to remove OH impurities. The expected isotopic shift in the tunneling spectrum when deutrated hydrocarbons are absorbed has been observed ( 61 > 62 ). The detection of hindered rotational excitation of HC1 and CH 3 impurities in metal-GaAs tunnel contacts has been reported by Thompson (61). Samples exposed to room air for even a few minutes before the evaporation of the top electrode, produced spectra indicating contamination of organic molecules ( 5 9 ). The peak between 115—120 meV in Figs. 22 and 23 was originally attributed to an OH bending mode of nearly free OH groups, but has recently been identified as being due to an OH bending mode of an alumina hydrate ( 6 2 ). From this new assignment of the peak between 115—120 meV appearing in all plasma oxidized ( 6 3 ) Al-Aloxide-metal tunnel junctions it has been concluded that the insulating layer grown on the Al film consists of alumina hydrate rather than aluminium oxide ( 6 2 ). A further OH mode at 75 meV has been found by Geiger et al. ( 6 2 ) in Al-Al-oxidePb junctions. It is thought that this OH mode is due to the torsional motion of OH groups about Al-0 linkages at the surface of the oxide. In conclusion of this subsection we note that the evaluation of the inelastic tunneling current has been carried out by Scalapino and Marcus (64), Lambe and Jaklevic (60), Duke (2), Pollack and Seitschick ( s ), and very recently by Brailsford and Davis (6S), and Davis (66). 3.2. Electron-Plasmon and Electron-Phonon Interaction in GaAs-Metal Surface Tunneling Barriers This subsection first described experiments with n-type GaAs-Pb surface barrier tunnel junctions!) performed by Tsui ( 6 7 ). The n-type GaAs used were either Teor Se-doped single crystals. Junctions with different electron concentration n of the GaAs electrodes have been investigated. The lead electrode was superconducting. The superconductivity is, however, not relevant for the observation which will be described now. Fig. 24 shows structure in d 2 I/dV 2 marked by arrows, which is, following Tsui, due to the excitation of surface plasmons of the GaAs electrode. The broad peaks in d 2 I/dV 2 are antisymmetric and correspond to an increase in conductance of the Electron energy diagrams of such junctions with and without voltage bias are shown schematically in Fig. 1 9 ( a - c ) .
263
Fig. 24. d 2 I/dV 2 signal from n-type GaAs-Pb surface barrier tunnel junctions at 1 °K. The bias voltage, whose sign refers to that of the Pb electrode, is measured from the superconducting Pb
energy gap (from D. C. Tsui (67)).
junction. The dependence of the peak positions on the electron concentration is consistent with the formula for the volume plasma frequency («») p
m* • e^ •
C3-2-1)
The excitation threshold energies of 60 and 80 meV in Fig. 24 are in reasonable agreement with the plasmon energies obtained from the equation for the surface plasmon frequency w s = cop/ \ f 2 , using in eq. (3.2.1) the known electron concentration n = 5.4 • 10 18 cm" 3 and n = 9.5 • 10 18 cm" 3 , respectively. Furthermore, the effective electron mass m = 0.08 m 0 and the high frequency dielectric constant e„ = 11 • e 0 have been used. The latter two values are taken from Ref. ( 6 8 ), where Raman scattering by plasmons in n-type GaAs has been investigated. In the tunneling experiments Tsui did not find volume plasmon excitation. He supposed that the tunneling electrons do not penetrate beyond the electron density tailing layer of the GaAs crystal because of the short mean free path ( ^ 30 A) of the samples investigated. Duke, Rice and Steinrisser ( 6 9 ) have observed structure in d 2 I/dV 2 only in the reverse bias of n-type GaAs-Jn surface barrier tunnel junction. The location of the structure was also doping-dependent and has been identified with the volume plasmon energy in the GaAs electrode by independent correlation with the plasma minimum observed in the infrared reflectivity of the samples used in the tunneling measurements. 264
We finally note that the doping-independent strong structures at qV = ± 37 meV in Fig. 24 are attributed to the inelastic interaction of tunneling electrons with the zone-center longitudinal optical phonon mode of the GaAs crystal ( 67 > 75 ' 76 ). More extensive investigation of electron-phonon interaction in GaAs Schottky barriers, involving two phonon processes has been performed by Thomas and Queisser (7S). Excitations of metal phonons by tunneling electrons in Al-insulator-metal junctions will be reported in the next subsection.
3.3. Metal Phonons Observed in Al-Insulator-Metal Tunneling Junctions Very recently Chen and Adler ( 7 0 - 7 1 ) have studied inelastic electron tunneling in Al-AlxOy-metal junctions whereat particular attention has been paid to the cleanliness of the junctions. The Al-film was oxidized in a glow discharge ( 6 3 ) using pure oxygen. Further, contaminations from the rotary- and oil-diffusion pump have been obviously avoided by applying appropriate techniques. This was demonstrated by the fact that no peaks of hydrocarbon have been found in d 2 I/dV 2 (cf. section 3.1). Similar to the case of the Schottky barrier mentioned in the previous subsection, in M-I-M junctions tunneling electrons having an energy higher than the phonon energy of one of the electrode can excite metal phonons. Electron-metal phonon interaction has been observed by Chen and Adler ( 7 1 ) in Al-AlxOy-metal junctions for a variety of counter electrodes. This is shown in Fig. 25 where the even part of the derivative of the conductance, i.e. d a J dV is plotted versus voltage bias. The quantity d a J d V is normalized by dividing it by the zero bias conductance, a (0). In Fig. 25 the Al transverse and longitudinal phonons at 24 and 36 mV, respectively, are seen in all junctions. The structures due to Ag, Au, Sn, Pb, and In phonons are all indicated by arrows. The structures due to Al phonons are indicated only in the curve of the Al-Al x 0 y -Al junction. The transverse phonons in silver, expected at 13 mV, have not been observed. For the Al-Alx0y-Pb junction the superconductivity of the lead electrode was quenched by applying a magnetic field of 8 KG. In Fig. 25 it is further seen that the increase in conductance due to phonons in metals with a strong electron phonon coupling (Fig. 25b) is much larger than that in weak coupling materials (Fig. 25a und 25b). Finally, the readers attention may be drawn to Fig. 26 which demonstrates clearly the antisymmetric peaks due to inelastic tunneling in metal-insulator-metal junctions. The peaks at low bias are attributed to metal phonons and the peaks near 118 mV are attributed to vibronic excitation of an OH bending mode of an alumina hydrate.
3.4. Excitation of Oxide Phonons Phonon excitation in lead oxide by electron tunneling in Pb-I-Pb junction has been reported by Rowell, McMillan and Feldmann ( 7 2 ). The observed peaks in d 2 J/dV 2 265
ENERGY |mV)
ENERGY (mV)
Fig. 25. The normalized even part of derivative of the conductance for (a) Al-insulator-Al, Ag and Au and (b) Al-insulator-Pb, Sn and In at 4.2 °K. The curves are displaced vertically for
clarity (from Chen and Adler (71)).
Fig. 26 The normalized derivative of the conductance for a typical junction (Al-insulator-In)
(from Chen and Adler (71)).
The peaks at low biases are attributed to metal phonons and the peaks near 118 meV are attributed to vibronic excitation of alumina hydrate. 550 440 330 220 110 0 -110-220-330-440-550 ENERGY(mV)
could, however, not be compared exactly with data of optical phonon spectra of bulk lead oxide. It is thought that the lead oxide of the tunneling junctions is probably a mixture of various oxides. Phonons in the barrier layer of Mg-MgO-Mg and Mg-MgO-Al tunnel junctions have been observed by Adler ( 7 3 ). He could identify most of the peaks in d a J dV with infrared data on bulk MgO. The results are shown in Fig. 27. The location of the TA, TO, LA and, LO phonons are shown as deduced from infrared data of bulk 266
Fig. 27
TA
0
20
Even part of the second derivative of the current versus voltage (do/dV = d 2 I / d V 2 ) for a typical Mg-MgO-Mg junction. Numerals 1 t o 6 show the location of the infrared absorption peaks of bulk MgO. The peak at 28 m e V is due to the longitudinal phonons in Mg
TO
_1_
40
_1_
60
_1_
80
ENERGY
100
120
140
(from Adler (73)).
(meV)
MgO C 3 ) . The numerals show phonon energies of bulk MgO where in the interpretation of the infrared absorptions peaks two phonon processes are also involved C 73 ' 78 ). Jaklevic and Lambe ( 7 7 ) have observed oxide phonons in Cr-(Cr oxide) -metal and Y-(Yoxide)-metal junctions. The phonon peak positions in their tunneling spectra have been identified by infrared absorption data obtained from the oxide grown on Yttrium and chromium layers. Tunneling spectra due to the excitation of the (Cr oxide) barrier have been investigated also by Rocklin and Hansma. 3.5. Photostimulated Au-Impurity Assisted Tunneling in Esaki p-n Diodes Our last subjection is concerned with an new type of inelastic tunneling reported by Holonyak, Keune, Bumham, and Duke ( 7 4 ). These authors have found a photo — or large injection current — stimulated inelastic tunneling channel in p-n tunnel diodes doped with Au on the n-type side. The electron energy diagram of the p-n diode is shown in the inset of Fig. 28. The p-type side is biased positively. The observation which will be described now has not been made with undoped diodes. The current-voltage characteristics of the diodes are measured at 77 °K. The current-voltage characteristic labeled "no excitation" in Fig. 28 is obtained if relatively low biases 0.S volt) are not exceeded. On the other hand the curve labeled "with excitation" is measured if light of band gap or higher energy is shining on the device, or if sufficient high voltages are applied. If the diode is maintained at 77 °K the curve with the higher current may not decay completely to the unexcited case for over one hour after removing the light or electrical excitation. 267
Fig. 28. I-V characteristics of a GaAs tunnel diode at 77 °K formed by alloying Ge-doped Au-Sb eutectic on GaAs : Zn. The lower curve, labeled "no excitation," shows the characteristic obtained by sweeping the bias from 0 to 1 V. The upper characteristic is obtained upon shining band-gap or higher energy radiation upon the diode. The inset illustrates the mechanism thought to be responsible for the enhancement of the current (from TV. Holonyak, Jr., D. L. Keune, and R. D. Burnham and C. B. Duke (74)).
Following Holonyak et al. ( 7 4 ) the mechanism giving rise to the increase of the current in the negative resistance region of the p-n diode is as follows: 1. The radiation, or large injection current, induces quasistable, nonequilibrium charge states of the Au-impurities. The creation of such a state is represented schematically as Au + hv
Au* + q
where hv denotes the radiation energy, q the liberated electronic charge and Au* a quasistable charge state of Au. 2. The quasistable charge states Au* are active in tunneling. Their electronic excitation by the tunneling electrons gives rise to the opening of an inelastic channel. The energy loss of the tunneling electrons and the creation of Au**, an excited state of Au*, is schown schematically in the inset of Fig. 28. The threshold energy E e x c for the inelastic process is approximately 140 meV as may be observed in Fig. 28 from the onset of the curve labeled "with excitation". It should be noted that the above explanation of the described phenomena is based on a number of experimental observations made with the Au-doped p-n diodes and on the good agreement between the theoretical and experimental line shape associated with the inelastic tunneling process ( 7 4 ) . The physical nature of the quasistable charge state Au* active in tunneling is (probably) not known in detail. 268
References (') (2) (3) (4) (s) (6) (7) (8) (9)
"Tunneling Phenomena in Solids", Plenum Press New York 1969 (Edited by E. Bumstein and S. Lundqvistj. C. B. Duke, "Tunneling in Solids", Academic Press, New York and London 1969 (Edited By F. Setts, D. Turnbull and H. Ehrenreich). L. Eckertovà, phys. stat. sol. 18, 3 (1966). R. M. Hill, Thin Solid FUms 1, B9 (1967). S. R. Pollack and J. A. Seitschick in "Applied Solid State Science" vol. 1, Academic Press New York and London 1969 (Edited by R. Wolfe). P. J. Price and J. M. Radcliffe, IBM J. Res. Develop. 3, 364 (1959). W. Harrison, Phys. Rev. 123, 85 (1961). R. Stratton, J. Phys. Chem. Solids 23, 1177 (1962). R. Holm, J. Appi. Phys. 22, 569 (1951).
C 10 ) (") (12) (13) (14) (15)
J- G. Simmons, J. Appi. Phys. 34, 1793 (1963) and J. Appi. Phys. 34 2581 (1963). C. K. Chow, J. Appi. Phys. 36, 559 (1965). K. H. Gundlach, Solid-State Electron. 9, 949 (1966). K. H. Gundlach, G. Heldmann, Phys. Stat. Sol. 21 575 (1967). L. L. Chang, Phys. Lett. 29A, 125 (1969). W. Franz, Handbuch der Physik, Bd. 17, S. 155 Springer Verlag, 1956, (Editor S. Flügge).
(16) (17)
J. G. Simmons in "Tunneling Phenomena in Solids" Plenum Press New York 1969, p. 135 (Edited by E. Burnstein and S. Lundquist). F. W. Schmidlin, J. Appi. Phys. 37, 2823 (1966).
(18) (19) (20)
K. H. Gundlach, Solid-State Electron. 12, 13 (1969). J. G. Simmons, Brit. J. Appi. Phys. 18, 269 (1967). K. H. Gundlach, Phys. Lett. 24A, 731 (1967).
(21) (22)
D. V. Geppert. J. Appi. Phys. 35, 2151 (1964). A. Braunstein, M. Braunstein, G. S. Picus, and C. A. Mead, Phys. Rev. Letters 14, 219 (1965).
(23) (24) (25) (26) (27)
K. W. Shepard, J. Appi. Phys. 36, 796 (1965). O. L. Nelson and D. W. Anderson, J. Appi. Phys. 37, 77 (1966). F. L. Schiiermeyer, J. Appi. Phys. 37, 1998 (1966). W. Ludwig and B. Korneffel, Phys. Stat. Sol. 24, K137 (1967). A. L. Musatov and S. K. Tsvetaev, Soviet Physics Solid State 12, 242 (1970) (engl, translation). K. H. Gundlach in Proc. Int. Symp. on Basic Problems in Thin Filrn Physics, ClausthalGöttingen (1965) P. 696 (edited by H. Mayer and R. Niedermayer), Vandenhoeck and Ruprecht, Göttingen 1966.
(28)
(29) K. H. Gundlach and J. Hölzl, to be published, in Surface Science (29 a) K. H. Gundlach and J. Hölzl, Congres International sur les Couches Minces, Supplement ala Revue Le Vide No 147, 345 (1970). (30) W. I. Bernard a n d / . W. Cook, J. Electrochem. Soc. 106, 643 (1959). (31) K. H. Gundlach and A. Wilkinson, Phys. Stat. Sol. (a) 2, 295 (1970). (32) J. G. Simmons, J. Appi. Phys. 35, 2655 (1964). (33) T. E. Hartman, J. Appi. Phys. 35, 3283 (1964).
269
S. R. Pollack and C. E. Morris, Trans. MS AIME 2 3 3 , 4 9 7 (1965). L. L. Chang, P. J. Stiles and L. Esaki, J. Appl. Phys. 3 8 , 4 4 4 0 (1967). L. L. Chang, P. J. Stiles and L. Esaki, IBM J. of Research and Development 10, 485 (1966). B. Pistoulet and M. Rouzevyre, in Proc. Internat. Symp. Basic Problems in Thin Film Physics, Clausthal-Gottingen 1965, (Editors//. Mayer and R. Niedermayer) Vandenhoeck and Ruprecht, Gottingen 1966. W. Gericke and W. Ludwig, phys. stat. sol. (a) 1, 189 (1970). K. H. Gundlach, Thin Solid Films 3, 251 (1969). G. Lewicki and C. A. Mead, Phys. Rev. Lett. 16, 939 (1966). G. Lewicki and C. A. Mead, J. Phys. Chem. Solids 29, 1255 (1968). C. A. Mead in "Tunneling Phenomena in Solids" Plenum Press New York 1969, p. 127 (Edited by E. Burnstein and S. Lundquist). R. Stratton,
G. Lewicki
and C. A. Mead, J. Phys. Chem. Solids 27, 1599 (1966).
e. g. F. K. Schulte and H. Bross, Z. Physik 224, 190 (1966). S. Kurtin,
T. C. McGill and C. A. Mead, Phys. Rev. Lett. 25, 756 (1970).
F. A. Padovani and R. Stratton,
Phys. Rev. Lett. 16, 1202 (1966).
G. H. Parker and C. A. Mead, Phys. Rev. Lett. 21, 605 (1968). L. Esaki and P. J. Stiles, Phys. Rev. Lett. 16, 1108 (1966). L. Esaki, J. Phys. Soc. Jap. 21, (supplement) 589 (1966). L. Esaki, P. J. Stiles and L. L. Chang, Phys. Rev. Lett. 20, 1180 (1968). G. H, Parker and C. A. Mead, Appl. Phys. Lett. 14, 21 (1969). J. C. Penley, Phys. Rev. 128, 596 (1962). J. W. Gadzuk, J. Appl. Phys. 41, 286 (1970). R. Hrach, Czech. J, Phys. B20, 32 (1970). R. Hrach, Czech. J. Phys. B20, 307 (1970). K. H. Gundlach, to be published. /. W. Gadzuk, Phys. Rev. B 1, 2110 (1970). A. Messiah, Quantum Mechanics (John Wiley and Sons, Inc., New York, 1962), Vol. II, p. 1006. R. C. Jaklevic a n d / . Lambe, Phys. Rev. Lett. 17, 1139 (1966). J. Lambe a n d « . C. Jaklevic, Phys. Rev. 165, 821 (1968). W. A. Thompson,
Phys. Rev. Lett. 20, 1985 (1968).
A. L. Geiger, B. S. Chandrasekhar
and / G. Adler, Phys. Rev. 188, 1130 (1969).
/. L. Miles and P. H. Smith, J. Electrochemical Society 110, 1240 (1963). D. J. Scalapino and S. M. Marcus, Phys. Rev. Lett. 18, 459 (1967). A. D. Brailsford and ' C. Davis, Phys. Rev. B 2, 1708 (1970). L. C. Davis, Phys. Rev. B 2, 1714 (1970). D. C. Tsui, Phys. Rev. Lett. 22, 293 (1969). A. Mooradian and G. B. Wright, Phys. Rev. Lett. 16, 999 (1966). C. B. Duke, R. M. Rice and F. Steinrisser, Phys. Rev. 181, 733 (1969). J. G. Adler, Phys. Lett. 29A, 675 (1969). T. T. Chen a n d / . G. Adler, Solid State Commun. 8, 1965 (1970). / . M. Rowell,
270
W. L. McMillan, and W. L. Feldmann,
Phys. Rev. 180, 658 (1969).
(73) (74) (75) (76) (77) (78)
J. G. Adler, Solid State Commun. 7, 1635 (1969). N. Holonyak, Jr., D. L. Keune, R. D. Burnham and C. B. Duke, Phys. Rev. Lett. 24, 589 (1970). P. Thomas and H. J. Queisser, Phys. Rev. 175, 983 (1968). S. S. Mitra, Phys. Rev. 132, 986 (1963). R. C. Jaklevic a n d / . Lambe, Phys. Rev. B 2, 808 (1970). M. P. Verma and B. Dayal, phys. stat. sol. 19, 751 (1967).
271
Festkörperprobleme XI (1971)
Plasma Physics and Astrophysics D.ter Haar Department of Theoretical Physics, Oxford University, 12 Parks Road, Oxford 0 X 1 3PQ
Summary: A Survey is given of a few astrophysical problems for which the properties of the astrophysical plasma axe important.
Zusammenfassung: Wir veranschaulichen die Bedeutung des astrophysischen Plasmas mit einer Besprechung einiger astrophysischen Probleme.
It is not surprising that plasma physics is playing an ever increasing part in astronomy. On the one hand, the temperatures and pressures, both in the interiors and in the atmosphere of stars, are such that matter is ionised. On the other hand, the space between the stars is filled with radiation and, although the total energy density is low, the quality of the radiation is high, by which we mean that the spectral distribution roughly corresponds to black-body radiation of a temperature of around 104 °K. This means that in most regions of space there are a sufficient number of high-energy quanta present to ionise all atoms, except perhaps hydrogen and helium. In fact, if one takes into account the ionising power of cosmic rays, one finds that in our galaxy even in H I regions, that is, regions where the hydrogen atoms are not ionised, there is an electron density of about 0.03 electron per cm 3 , while in H II regions where the hydrogen atoms are ionised the electron density lies somewhere between 1 and 10 per cm 3 . Finally, we must mention that stars emit ions and electrons into interstellar space. An example is the solar wind, which in recent years has been studied by satellite experiments. It is thus to be expected that there are many aspects of astrophysics for which plasma phenomena will be of importance. If we remember that the 1966 Varenna Summer School on Plasma Astrophysics, which only dealt with part of the subject, lasted for three weeks and that since then several new fields of applications, amongst which are the pulsars, have been opened up, it cannot be expected that we can do anything more than indicate some the interesting problems and sketch some of the aspects of plasma physics relevant to astrophysics. We must also point out that in most cases we must expect that we are dealing with a magneto-plasma, since magnetic fields seem to occur practically everywhere in the universe. In fact, several authors, such as Parker and Cameron, have pointed out that a seed magnetic field which will occur due to the motion of charged particles and which may be as small as 10"10 or 10"12 gauss will be enhanced in the turbu18 Festkörperprobleme X I
273
lent medium. From the Maxwell equations (for the sake of simplicity we write the Maxwell equations for the case of a vacuum, we assume that there is overall charge neutrality, and we use c.g.s. units), (v.H) = 0, (v. E) = 0, [ v A E ] = - i f f , [ v A H ] = ^ i + ± | f -
(1)
it follows that if L is a characteristic length scale, the characteristic time scale T for the build-up or decay of magnetic fields will be of the order (a is the conductivity) r ~ f ,
(2)
which in most cases is very large compared to the age of the universe. We have used here the equation j=ff [ t + l [vAH]} .
(3)
However, if there is a turbulent plasma, L may become small and also a will become smaller (decrease in mean free path) and magnetic flux loops may be produced; these will accelerate particles and some kind of equilibrium will be attained in which the magnetic energy, the kinetic energy of the particles, and the turbulent energy all become of the same order of magnitude. Roughly speaking, we then get 1 2
2
H2 ~ 8tt '
(4)
from which it follows that H~\J~4np v,
(5)
and we find for interstellar space where p ~ 10 -24 g cm"3 and v ~ 3.105 cm s ' 1 , that H ~ 1 /i gauss.
(6)
Let us briefly enumerate various parts of our universe where we encounter plasmas. Perhaps we should leave out the ionosphere and the radiation belts, as they belong to terrestrial physics rather than astrophysics, although in the case of the radiation belts, the influence of the sun is a determining factor. Leaving the earth and its atmosphere, we come to interplanetary space through which charged particles travel, partly coming from the sun (solar wind), and partly being cosmic rays. Other planets have their own atmospheric plasmas, and, for instance, the decametric radioemission from Jupiter which is strongly correlated with the motion of its satellite Io seems to be a plasma effect where instabilities in the flux tubes connecting Io with the surface of Jupiter seem to produce the observed radio-emission. We next come to the Sun with its corona, photosphere, sunspots, flares and bursts. The interstellar medium, as we discussed earlier, is a magnetoplasma. Many stars have 274
magnetic fields and the coupling of the rotation of a star to the interstellar plasma through magnetic forces poses many questions about the possible slowing down of stellar rotation. The problem of the origin of stellar magnetism is probably also a plasma problem, but one we shall not have time to discuss. The recently discovered pulsars seem to be magnetic neutron stars, which are surrounded by a magnetosphere. The radio-emission from quasars, radio "stars", and radio-galaxies indicates a few more astrophysical plasmas, while the acceleration of cosmic rays to energies of the order of 109 GeV or higher can most easily be understood, if this acceleration comes from the interaction of plasma turbulence and particles. Let us now look at what kind of plasma phenomena will be of interest, and how they can help in understanding various astronomical observations. There are two aspects of this. As almost all astronomical observations consist in the registration of electromagnetic waves, we are interested either in electromagnetic waves which are produced in plasmas and ask whether certain types of radiation patterns can be thus produced or in the effect of a plasma which is traversed by the electromagnetic waves on the radiation. A small class of astronomical observations consist in the registration of charged particles (solar wind, cosmic rays) and the problem of interest then is the possible acceleration of those particles. Before studying specific astrophysical systems, we shall briefly discuss (i) particle acceleration in a plasma; (ii) emission by particles in a plasma; (iii) emission through collective motions in plasma; and (iv) the influence of a plasma on electromagnetic radiation passing through it. Charged particles are accelerated in a plasma through the occurrence of fluctuating electric fields. They will thus increase their energy through statistical acceleration processes. A typical example is the so-called Fermi mechanism, which is usually described as the bouncing off of particles from magnetic field lines. Broadly speaking, the particle system will gain energy from the magnetic field system, since the average energy per degree of freedom of the latter is so much larger than that of the former. Put differently, if u is the velocity of the magnetic "wall" and v and e the velocity and energy of the particle, the particle will gain an energy ~ 2e u v/c2 in a head-on collision, and lose the same amount in a tail-on collision. If L is the average distance between magnetic "walls" the number of head-on collisions per unit time is (v + u)/L and the number of tail-on collisions (v - u)/L, so that the average rate of change of energy de/dt is given by the equation de 4 evu2 dt ~ Lc2 '
. .
(7)
which shows that the acceleration becomes more effective for higher energies and also that the smaller the scale of the magnetic inhomogeneities, the larger the acceleration rate. When a particle moves in a magneto-plasma, it can emit in different ways. It can emit bremsstrahlung when it is deflected by another particle. It can also emit 275
magneto-bremsstrahlung when it is accelerated in a magnetic field. This emission is often called synchrotron radiation when the particle has a relativistic energy of cyclotron or gyro-radiation for the case of a non-relativistic particle. The frequency of this radiation is the cyclotron frequency w H which for electrons is given by the equation c o H e = f c ~ 10 7 H Hz.
(8)
If the particle velocity is larger than the phase velocity in the medium, it can emit Cherenkov radiation, and if it moves through a region where the dielectric constant rapidly changes, it emits transition radiation. In a plasma there are several collective modes, and we mention especially the Langmuir plasma oscillations and the hydromagnetic (Alfv6n) waves. The frequency of the plasma oscillations is to a first approximation the plasma frequency cop which for electrons is given by the equation W
P e
=
'
o r
" p e ~ 1 0
5
^ N ,
(9)
where N is the number of electrons per cm 3 . In Table 1 we have given the values of N, oj p e , H, and w H e for a number of astrophysical plasmas. Table 1.
Radiation belts Interplanetary medium Corona Photosphere Sunspot Interstellar medium Pulsar magnetosphere
N (cm-3 )
cjpe (Hz)
H (gauss)
WHe 2 + k 2 c 2 ,
(20)
where u>p is given by equation (9). The first consequence of equation (20) is that a signal will be dispersed. The group velocity v^ = d co/dk satisfies for the case where w > cop the equation Vgr_
c
1 dco c dk
,
(21)
OJp
2co2
and if the radiation passes through a medium with a varying density N, the components of frequencies a?! and co2 will arrive at different times ti and t 2 where J w2
t,
I_ w w
2
2
JJ
2*re2 mc / Ndl.
(22)
If the original signal is a sharp one emitted simultaneously over a wide band of frequencies, as, for instance, the pulsar signal probably is, the delay time can give us information about the electron density distribution. Fluctuations in the electron density will produce a broadening of the signal which is stronger for longer wavelengths — as is observed for pulsar signals - and also scintillations, which have been discussed by Scheuer and Salpeter. We can express the time- and space dependence of a wave in the form of a factor ex
27r
i IT
, (r-Vt)
(23)
and if the wave passes through an irregularity with extra density A N and of linear size a, there will be a phase shift dtp given by the expression .
Y
2it 1 47re2 AXT X2 a e2 ~ — • - —— AN . 2 2 c c- = —22 ^ a AN. m \ 2 4tt C mc
, .. '
v(24)
If the wave passes through a path-length L, the root mean square phase shift Ayj will become A^-v^ 278
V ^
XAN,
(25)
while the average scattering angle 6SC will be of the order sc
2n
a
mc
a
ANA 2 .
(26)
In order that these fluctuations produce scintillations, it is necessary (i) that Aip> ir, or
and (ii) that several beams interact, which means that L 0SC > a, or AN ^ mc 2 > / L ¡STa^-Fx5"-
(
}
If one plots these conditions for the case of pulsars, for instance, one finds that relatively small values of AN and values of a of the order of 1012 cm will produce large amplitude variations at radio-frequencies for practically all pulsars (L >; 1020 cm). The path differences from different paths will be of the order of L 0 2 c , corresponding to a phase difference of the order of L 02C/A. Correlations of scintillations over a band-width AX will occur provided AX ~ X2 / L 0^., from which it follows that AX ~ X2 / L 8j c ,
(29)
which is proportional to L'2 as was observed by Rickett. Hewish and coworkers have used this scattering mechanism to study, on the one hand, electron densities, for instance, in the corona and, on the other hand, angular dimensions of radio-sources. Other effects of a plasma on electromagnetic radiation will be absorption or stimulation of radiation and the selection of particular modes of polarisation. This may possibly explain the peculiar polarisation properties of the pulsar emission. This problem has been studied extensively by Zheleznyakov and Ginzburg. As far as maser action in plasmas is concerned, we may mention that, if we look at fluctuations 6e in the dielectric constant — which will occur with the plasma frequency cop — through the Maxwell equations, we will get a charge density fluctuation 6p=-^(v6eE),
(30)
and apart from the original frequency co0 which occurs in E, frequencies co0 ± cop will occur in 5p, and thus in the radiation emitted from the plasma. Let us in conclusion quote Alfven to show that many of the problems mentioned here are still far from being satisfactorily solved: "Our simple approach has not given even a first approximation to the truth. The reason for this is that several of 279
the basic concepts o n which the theories are founded, are not applicable t o t h e conditions prevailing in the universe. They are 'generally accepted' b y most theoreticians, t h e y are developed with the most sophisticated m e t h o d s and it is only the plasma itself which does not 'understand' h o w beautiful the theories are and absolutely refuses t o o b e y t h e m . "
References We have not referred to literature in the body of the text, as we have only given a bird's eye view of the field. For those readers who want to study the field any further we give here a highly prejudiced and personal - selected list. General coverage can be found in: Plasma Astrophysics (Ed. P. A. Sturrock), Academic Press, 1967. Transactions of the International Astronomical Union, Vol. XIV A, Reports on Astronomy, Report by Commission 43 (Plasmas and Magnetohydrodynamics in Astrophysics). H. Alfven and C-G. Fälthammer, Cosmical Electrodynamics, Oxford University Press, 1963. For solar and planetary phenomena we refer to: V. V. Zheleznyakov, Radio Emission of the Sun and Planets, Pergamon, 1970. For cosmic rays we refer to: V. L. Ginzburg and S. I. Syrovatskii, The Origin of Cosmic Rays, Pergamon, 1964. For pulsars we refer to: V. L. Ginzburg and V. V. Zheleznyakov, Comments Ap. Space Phys. 2, 167 and 197 (1970). D. terHaar, Phys. Repts, 1 (1971) (in press). We finally refer to the following books and review articles which we have found useful: A. /. Akhiezer, /. A. Akhiezer, R. V. Polovin, A. G. Sitenko and K. N. Stepanov, Collective Oscillations in a Plasma, Pergamon, 1967. V. L. Ginzburg, The Propagation of Electromagnetic Waves in Plasma, Pergamon, 1970. S. F. Smerd, Proc. Astron. Soc, Australia 1, 124 (1968). V. N. Tsytovich, Soviet Phys. - Uspekhi 12, 42 (1969).
280
Festkörperprobleme XI (1971)
Kinetische Beschreibung der schwachen Turbulenz Klaus Elsässer Max-Planck-Institut für Physik und Astrophysik, München
Summary: A stochastic model equation for weakly interacting dispersive waves is discussed. In section 2 we derive a Langevin equation for the amplitude of a damped oscillator in a thermostat. In sections 3 and 4 we sketch briefly the kinematics and dynamics of an ensemble of coupled oscillators along the lines of a recently developed theory ( 8 )t The result is again a Langevin equation for the mode amplitudes together with a kinetic equation for the thermostat ("kinetic wave equation"). In section 5 the stochastic model equation is applied to the Brownian motion of a single oscillation, and the transition probability previously given by I. Prigogine (( 1 6 ), chapter 3) is obtained. Zusammenfassung: Eine stochastische Gleicli-'ng fur schwach wechselwirkende Wellen wird diskutiert. In Abschnitt 2 wird der Prototyp dieser Gleichung abgeleitet, nämlich eine LangevinGleichung für die (komplexe) Amplitude eines schwach gedämpften Oszillators in einem Wärmebad. Die Abschnitte 3 und 4 skizzieren kurz die Kinematik und Dynamik eines Ensembles gekoppelter Oszillatoren anhand einer neueren Arbeit (®). Das Ergebnis ist eine Langevin-Gleichung für jede Schwingungsamplitude und eine kinetische Gleichung für das Wärmebad (,.kinetische Wellen-Gleichung"). In Abschnitt 5 wird aus der stochastischen Gleichung die Übergangswahrscheinlichkeit für das Problem der Brownsclien Bewegung einer einzelnen Schwingungsamplitude berechnet; das Ergebnis stimmt mit der Formel von I. Prigogine ( 1 6 ) überein.
1. Einleitung Die wesentliche Aufgabe einer kinetischen Theorie besteht darin, für ein Problem mit praktisch unendlich vielen Freiheitsgraden überschaubare und traktable Näherungen zu finden, um Relaxationsprozesse beschreiben zu können. Als bekanntestes Beispiel sei die kinetische Gastheorie erwähnt, in welcher die Boltzmannsche Stoßgleichung als kinetischer Ersatz für die Liouville-Gleichung in allen Anwendungen ausreicht. Hier soll von einer kinetischen Theorie die Rede sein, welche die Relaxation turbulenter dispersiver Wellen beschreibt. Die „Boltzmann-Gleichung" für dieses Problem — heutzutage wird sie meistens „kinetische Wellengleichung" genannt wurde schon 1929 vonR. Peierls ( ' ) gefunden, und zwar als Transportgleichung für die Anzahl der Phononen (pro Wellenzahl-Intervall) in einem Kristall, wobei die Anharmonizität der Gitterkräfte für die elementare Phonon-Phonon-Wechselwirkung sorgt. Die Boltzmannsche Hypothese des „molekularen Chaos" ist hier ersetzt worden durch die Annahme, daß die Phasen der Wellen gleichverteilt sind; die Richtigkeit beider Annahmen beruht darauf, daß es Prozesse gibt, welche das „Chaos" bzw. die GleichVerteilung wiederherstellen, falls sie zu einer bestimmten Zeit nicht mehr vorhanden waren: Im ersten Fall sind es die Stöße zwischen den Gasmolekülen, im zweiten Fall sind es die elementaren Wellenprozesse. 281
Während aber in der Festkörperphysik die anharmonischen Wechselwirkungen der Wellen (Phononen) nicht besonders gut bekannt sind, haben sich in den letzten zehn Jahren verschiedene Anwendungsgebiete gefunden, in denen die nichtlineare Wechselwirkung wohlbekannt ist, da sie aus klassischen Bewegungsgleichungen folgt. Als erstes seien die Schwerewellen in einem Ozean erwähnt (Fig. 1), welche vom Wind stochastisch angeregt werden können( 2 ), ( 3 ) . Es handelt sich um Oberflächen-Wellen, welche aus den hydrodynamischen Gleichungen durch zwei Randbedingungen an der Oberfläche folgen: Eine kinematische Randbedingung, welche die materielle Änderungsgeschwindigkeit der Oberfläche mit der Vertikalkomponente des Geschwindigkeitsfeldes verknüpft, und eine dynamische Randbedingung, welche nach dem Bernoullischen Satz den Effektiv-Druck an der Wasseroberfläche dem äußeren Luft-Druck gleichsetzt. Beide Randbedingungen enthalten nichtlineare Terme, welche Energie von einem Schwingungsmodus auf einen anderen übertragen können. Als zweites
V = V ;
11 at
fU
(VH..J-
" P
at
0 3f at
282
Aue
Ü ) az ' z . - j
n
-iv4)z._
'«-i
— ©
• v • Vf• m
V E -
A - 0
Jd\f
IL
3V
-
-
0
Fig. 2
Fig. 1
Beispiel seien die Elektronen-Plasmaschwingungen in einem Plasma genannt (Fig. 2), welche durch eine Plasmainstabilität stochastisch angeregt werden können. Wenn man die Elektronen durch eine stoßfreie Boltzmann-Gleichung (Vlasov-Gleichung) beschreibt, so sorgt das kollektive elektrische Feld für die nichtlineare Wechselwirkung (nichtlineare Landau-Dämpfung( 4 ), ( 5 )). Beide Beispiele stehen für viele; in der Hydrodynamik (auch der inkompressiblen!) sind z. B. Wellentypen in rotierenden Flüssigkeiten bekannt (Trägheitswellen, Rossby-Wellen( 6 )), während in der Plasmaphysik das elektromagnetische Feld und die Vielzahl der Plasma-Parameter zu vielen Möglichkeiten der Anregung führen( 7 ). Das wesentliche an den obigen Beispielen war: a) Die Flüssigkeit wird stochastisch angeregt b) Rückstellkräfte bewirken eine oszillatorische Bewegung (mit Dispersion) c) Nichtlineare Terme sorgen für eine schwache Wechselwirkung zwischen den einzelnen Schwingungsmoden. Wenn diese Voraussetzungen gegeben sind, sprechen wir von schwacher Turbulenz. Im Gegensatz zur gewöhnlichen hydrodynamischen („starken") Turbulenz enthält die ungeordnete Bewegung nur wenig Energie; es handelt sich lediglich um „überthermisches Rauschen". Die kinetische Beschreibung dieses Rauschens ist daher bestimmt durch die zeitliche Entwicklung eines „Wärmebades", welches aus unendlich vielen Oszillatoren — den Eigenschwingungen der Flüssigkeit — besteht. Ein Zusammenhang zwischen schwacher Turbulenz und der Theorie der Brownschen Bewegung kann von "first principles" hergeleitet werden( 8 ) und bildet den Hauptteil dieser Darstellung.
2. Der einzelne Oszillator im Wärmebad Wir betrachten zunächst die Bewegungsgleichung für einen Schwingungsmodus x(t), wobei die Wirkung aller übrigen Freiheitsgrade durch eine stochastische Kraft F ( t ) und eine Dämpfung simuliert werden soll: x + 2j3x + iL>ox = F(t)
(1)
OJ0 ist die Kreisfrequenz der betrachteten Schwingung, und ß eine kleine Dämpfungskonstante (ß/cj0 1)- Dieses Problem wurde bereits von M. C. Wang und G. E. Uhlenbeck(9 ) und S. Chandrasekhar ({0 ) durch Angabe der Übergangswahrscheinlichkeit für x(t) exakt gelöst. Im Hinblick auf die schwache Turbulenz fragen wir nach einer stochastischen Gleichung für die Amplitude der Schwingung; später werden wir (Kapitel 5) eine asymptotische Gleichung für die Ubergangswahrscheinlichkeit des Amplitudenquadrats — also im wesentlichen der Energie der Schwingung — ableiten und lösen. Zur Lösung von Gl. (1) machen wir den Ansatz x=a(t)e-iwt + a*(t)eiwM
(2) 283
co ist die komplexe Kreisfrequenz des Oszillators für den Fall F ( t ) = 0 , nämlich: w = co, - i(3; CO, = ± n / coä - ß2
(3)
a(t) ist ein komplexer Amplitudenfaktor, dessen Zeitabhängigkeit auf die Wirkung der Kraft F ( t ) zurückzuführen ist; in einer bequemen Eichung (siehe Chandrasekhar(10)) kann a(t) als eine passende Lösung der Gleichung ä e ~ i u M + c. c. = 0
(4)
gewählt werden (c. c. bedeutet das komplex Konjugierte des vorangehenden Ausdrucks). Dann erhalten wir durch Einsetzen von ( 2 ) in ( 1 ) nur noch eine weitere Differentialgleichung erster Ordnung für a(t), nämlich: - i c o ä e " i w t + c. c. = F ( t )
(5)
ä=
(6)
oder 7 i ß i c J ' F(t) co + CO*
Die eigentliche komplexe Schwingungsamplitude c ( t ) erhalten wir durch Abspalten des Imaginärteils von co, nach ( 3 ) und ( 2 ) also: c(t) = a ( t ) e " f l t ;
x = c ( t ) e ' ^ i 4 + c. c.
(7)
Für diese Amplitude erhalten wir nach ( 6 ) folgende stochastische Bewegungsgleichung: c(t) + ß c(t) = A(t)
(8)
A(t) = 2^eiWltp(t)
(9)
mit
Wenn F ( t ) ein „weißes Rauschen" repräsentiert, so gilt für die zeitliche Korrelationsfunktion: < F ( t ) F ( t ' ) > = F • ö (t - 1 ' )
(10)
wo ö(t - 1 ' ) die 5-Funktion und F eine positive Konstante bedeutet. A ( t ) ist nach ( 9 ) die komplexe Zusammenfassung zweier stochastischer Prozesse; deren Intensität wird charakterisiert durch die Korrelation c durch Subtrahieren aller möglichen Grenzwerte vom n-ten Moment (13), welche entstehen, wenn n Ortsvariablen in weit separierte Untergruppen eingeteilt werden, also z. B. (mit < \p (x, t) > = 0): < ^ ( X l > t) . .
t) > c = < ^(X!, t) . . . iKx4, t) > - < «Kxi, t) - 2
t) >
< * ( x
3
,
t)
3
t ( x
4
,
t) > (14)
- 2 •*-> 4 Dadurch entsteht aus dem n-ten Moment eine Größe, welche bezüglich n - 1 Ortsvariabler im üblichen Sinne Fourier-transformierbar ist. Zur Vereinfachung ersetzen wir jedes Variablenpaar (kj, aj) durch einen Index j und verwenden gestrichene Indices für Summations- bzw. Integrationsvariable. Dann können wir analog zu (13) schreiben: ° = < Cj- . . . C > > C Xi' • • • Xn' exp [ i ^ k , Xj - i j j n
COj, t
(15)
Für ein homogenes Ensemble mit endlichen Korrelationslängen gilt nun < C! . . . c n > c = 5 3 (k, + . . . + k n ) x „glatte" Funktion von k j . . . k n . j (16) Die Wellenkorrelationen (16) haben ein erzeugendes Funktional, das „Cluster Funktional": Z(t,a1) = log0
dt
= 2
.
e"P"(Z)
(22b)
v>0
Die Zerlegung von Z in einen asymptotischen (kinetischen) Teil Z und einen Rest, der explizit von einer schnellen Zeit t und implizit über Z von langsameren Zeitskalen abhängt, entspricht einer asymtotischen Störungstheorie, wie sie von Krylov-Bogoljubov-Mitropolski ( 1 4 ) zur Lösung gewöhnlicher Differentialgleichungen entwickelt und erprobt wurde. Z ist durch zwei Forderungen eindeutig definiert: Erstens muß für eine Anfangszeit t = 0 Z mit Z übereinstimmen, und zweitens darf Z - Z bezüglich der schnellen Zeitskala nicht säkular anwachsen. Dadurch können die kinetischen Ausdrücke P"(Z) auf der rechten Seite von (22b) bestimmt werden, ' ) Diese ergibt sich z. B. aus den Zwei-Flüssigkeits-Gleichungen für elektrostatische Plasmaschwingungen ( 1 2 ) ; die allgemeinste Form einer Amplituden-Gleichung folgt aus einer mikroskopischen Behandlung des gleichen Problems ( 1 3 ) .
287
und in der niedrigsten Ordnung für dispersive Wellen, nämlich v = 2, erhalten wir folgende kinetische Gleichung für Z: 9(e t )
Z =
•Hi» Ld(e t)
S Z 1 ai' g ^ ; x+ 2 TF? i ' a i ' a - ! '
(23)
Die Funktionen H 4 und Fi hängen folgendermaßen mit dem Spektrum Ii zusammen: t Hi
4i
Vl2'3' v 3 ' i - 2 ' e u>n'3'
j dt' I 2 ' ( 0
Fi = 4ir S (ki - k 2 - - k 3 ') 8 (a>i2'3') I v12'3' I2 I2' I3'
(24)
(25)
Durch Entwicklung von Z nach Potenzen der Testfunktion a t erkennt man aus (23) sofort, daß das Spektrum Ii der kinetischen Wellengleichung genügen muß, welche in unserer Notation lautet: d(e2t)
Ij = 2 Re
9(e2t)
Hi
Ii+Fi
(26)
Der erste Term auf der rechten Seite von (26) bedeutet i.a. eine Dämpfung der Schwingung (ki , oti), z. B. durch „Zerfall" in andere Moden, während der positiv definite Term F i die resonante Energiezufuhr in den Schwingungsmodus ( k i , a j darstellt. Natürlich hängt es neben den Matrixelementen v 1 2 3 entscheidend von der Dispersionsbeziehung ab, ob diese „drei-Wellen-Prozesse" überhaupt möglich sind, oder ob erst Prozesse höherer Ordnung eine Relaxation in einer entsprechend längeren Zeitskala herbeifuhren. Um die Prozesse niedrigster Ordnung zu verstehen, haben wir in ( 8 ) die allgemeine Lösung der Gleichung (23) angegeben und untersucht; sie lautet: Z ( t , a i ) = Z 0 (a x - e H l ( t ) ) + Z G ( t , a t )
(27)
Hier ist Z 0 ( a i ) das Cluster-Funktional, welches die Korrelationen bei t = 0 erzeugt, und Z G ein Gaußsches Funktional (es erzeugt nur Zweier-Korrelationen), welches bei t = 0 noch Null ist und durch die resonanten Prozesse in Fi (Gl. (25)) entsteht. Mit Hilfe der Gl. (17) läßt sich aus (27) eine stochastische Gleichung für die „Wellenamplituden" Ci (t) ablesen, nämlich c, + 0 ! ci = A i ( t )
(28)
wobei der Reibungskoeffizient ßi und die stochastische Kraft Ai (t) über die in (24), (25) definierten Größen H(, Fi mit dem Spektrum zusammenhängen: (29) < A, (t) A 2 ( t ' ) > = 5 3 (ki + k 2 ) 6 ( a , , a 2 ) 5 ( t - 1 ' ) F , 288
(30)
Aj (t) ist Gauß-verteüt und daher durch (30) eindeutig charakterisiert. Gl. (28) ist die schon von Gl. (8) her bekannte Verallgemeinerung einer Langevin-Gleichung für eine Oszillator-Amplitude, wobei durch (29), (30) die Wechselwirkung mit den übrigen Oszillatoren ausgedrückt wird. Natürlich kann man wieder einwenden, daß eine Amplituden-Gleichung wie (28) im thermodynamischen Limes Undefiniert ist. Aber wir können (28) formal integrieren und die „Fourier-Transformation" (12) wieder rückgängig machen; dadurch gelangen wir zu einer stochastischen Gleichung für den Zustandsvektor \p(x, t), welche auch im thermodynamischen Limes wohldefiniert ist. Sie lautet: ^/(x, t) = / d 3 x ' K(x - x',t) • V(x\ 0) + t ( x , t)
(31)
K(x, t) = ¿ X i ' Xi' exp {ikj- • x - i a v t + H ^ t ) }
(32)
mit
7(x, t) ist ein Gauß'scher stochastischer Prozeß mit dem Mittelwert Null, wobei die räumliche Korrelationsfunktion gegeben ist durch: = x1'X-1'eikl'(xi-X2)-{l1'(t)-e2ReHl'(t)-I1'(0)} (33) Xi ist die zu Xi adjungierte normierte Eigenlösung des linearisierten Problems. Aus der stochastischen Gl. (31) ist abzulesen, wie in niedrigster Näherung die dritten und höheren Korrelationen zerfallen: Da 7(x, t) Gaußisch ist, handelt es sich bei den höheren Korrelationen nur um Anfangswerte, modifiziert durch den in (32) angegebenen Kern; dieser enthält aber den schnellen Phasenfaktor e " 1 " 1 ' t , der alle höheren Momente nach kurzer Zeit herausmittelt, soweit sie nicht in Produkte von Zweier-Momenten zerfallen; d.h. schon nach wenigen Wellen-Zyklen herrscht eine universelle Gauß-Verteilung.
5. Die Brownsche Bewegung einer Schwingungsamplitude Es ist instruktiv zu sehen, wie die Langevin-Gleichung (28) für die Thermalisierung einer einzelnen Schwingungsamplitude sorgt, wenn alle übrigen Amplituden bereits im Gleichgewicht sind. In diesem Falle hängen die Größen ßi, F t praktisch nicht mehr von der Zeit ab. Um auch im Falle eines kontinuierlichen Spektrums von einer einzelnen Schwingung reden zu können, verwenden wir anstatt der C!, A j die FourierStieltjes-Transformierten (vgl. 0. M. Phillips ( 2 )); wir schreiben symbolisch Cj = cj d 3 k j Bj = Aj d 3 k! 1 9 Festkörperprobleme X I
(34) (35) 289
und erhalten aus (28), (30) folgende Gleichungen: Cj +|3 1 C 1 =B 1 (t)
(36)
< B^t) > = 0
(37)
1) wie In
^e-n-T/2=e-nftt
(54)
abfallen, so daß die gesamte Lösung (50) nach dieser Zeit auch die Abhängigkeit von der aktuellen Phase a verliert. Für t - * oo erhalten wir unabhängig von den Anfangsbedingungen eine Gleichverteilung der Phasen und eine Boltzmann-Verteilung für x mit dem Mittelwert eins, also nach (51):
lil7
~
= '-V-
2/3,
') Gl. (53) für n = 0 wurde unabhängig auch von Dr. F. Meyer gefunden, wobei die exakte Lösung von Wang und Uhlenbeck als Ausgangspunkt diente.
291
oder in den ursprünglichen Bezeichnungen nach ( 4 4 ) , ( 4 0 ) und (34): < | C i | 2 >
~=§;
(55)
Das gleiche Ergebnis folgt natürlich auch unmittelbar aus der kinetischen Wellengleichung (26). Gl. ( 5 5 ) ist das Analogon zur Nyquist-Relation in der Rausch-Theorie oder zur Einstein-Relation in der Theorie der Brownschen Bewegung.
Literaturverzeichnis R. Peierls, Ann. Physik 3, 1055 (1929). 0. M. Phillips; J. Fluid Mech. 9, 193 (1960). K. Hasselmann, J. Fluid Mech. 12, 481 (1962). E. Frieman, und P. Rutherford, Annals of Physics 28, 134 (1964). B. B. Kadomtsev, "Plasma Turbulence", Academic Press, London 1965. H. P. Greenspan, ' T h e Theory of rotating Fluids", Cambridge University Press 1968. T. H. Stix, "The Theory of Plasma Waves", McGraw-Hill Book Comp., New York 1962. K. Elsässer, und P. Gräff, MPI/PAE-Astro 32, erscheint in Annals of Physics, New York. M. C. Wang, und G. E. Uhlenbeck, Rev. Mod. Phys. 17, 323 (1941). S. Chandrasekhar, Rev. Mod. Phys. 15, 1 (1943). A. S. Monin, und A. M. Yaglom, "Statistical Fluid Mechanics", MIT Press, Cambridge, Mass. 1970. K. Elsässer, MPI-PAE/Astro 24; siehe auch J. Plasma Phys. 5, 31 (1971). K. Elsässer, J. Plasma Phys. 5, 39 (1971). N. N. Bogoljubov, und Y. A. Mitropolski, "Asymptotic Methods in the Theory of Non-linear Oscillations", Hindustan Pubi. Corp., India 1961. P. Levy, "Processus stochastiques et mouvement brownien", Gauthier-Villars, Paris 1965. 1. Prigogine, "Nonequilibrium Statistical Mechanics", Interscience Publishers, New York 1962.
292
Festkörperprobleme XI (1971)
Stochastic Models in the Theory of Phase Transitions B. Ubbo Felderhof Institute for Theoretical Physics, Rijksuniversiteit, Utrecht, the Netherlands Summary: The kinetics of phase transitions is discussed with the aid of stochastic models. First a brief review is presented of nucleation theory as applied to the liquid-pas transition. Secondly, the stochastic Ising-model is discussed with emphasis on the effect of critical slowing down and some recent results are mentioned. Zusammenfassung: Die Kinetik der Phasenübergänge wird mit Hilfe stochastischer Modelle diskutiert. Erstens wird ein kurzer Überblick gegeben über die Anwendung der Nukleation-Theorie auf den Flüssigkeit-Gas-Übergang. Zweitens wird das stochastische Ising-Modell diskutiert mit Betonung des Effektes des critical slowing down und es werden einige neuere Ergebnisse erwähnt.
1. Introduction In the theory of phase transitions prof ound insights have been reached within the framework of equilibrium statistical mechanics from the study of exactly soluble models. As a prime example we may mention Onsager's famous calculation of the partition function of the 2-dimensional Ising-model in zero magnetic field ('). Thus the equilibrium theory of phase transitions is fairly well established on a microscopic basis. The non-equilibrium theory is much less developed for the obvious reason that a fully microscopic treatment starting from the Liouville equation is forbiddingly difficult. Yet for many physical situations the actual condensation process in time is of great interest. On the other hand, even when a system is in a one-phase state its non-equilibrium properties may be affected by the fact that it is thermodynamically close to a second phase. Near a critical point the usual transport equations lose their validity owing to the presence of long range correlations and large fluctuations in the system. In order to gain insight in these matters the study of stochastic models may be profitable. Here one relaxes the requirement of a fully microscopic treatment, but postulates the kinetics of the system at an intermediate level with a view of understanding its non-equilibrium behavior at a macroscopic level. In this lecture we shall discuss two types of stochastic models. The first model is commonly called nucleation theory and is closely related to the droplet model of equilibrium theory. We shall phrase this model in the language of the liquid-gas transition; it has its natural analogues for other types of phase transition. In view of the approximations made the term "model" is not out of place although one aims at a description of real physical systems and a comparison with experiment. The second model we shall discuss is the stochastic Ising-model in which the spins of an 293
Ising-system are assumed to flip with certain transition probabilities. The basic equation of this model is a markoffian master equation. In this case one aims firstly at mathematical simplicity so that the link with experiment is weaker, albeit not completely absent. Since the state of individual spins is specified the description is much more detailed than in the theory of nucleation and may be regarded as a natural extension of the equilibrium statistical mechanics of Ising-systems.
2. Nucleation theory There are several reasons to discuss the present state of the theory of nucleation. The foundations of the theory were laid more than thirty-five years ago ( 2 ' 3 ) and at that time acceptable agreement with a limited number of experiments was reached. ( 4 ) Over the last ten years the theory has received renewed interest. ( 5 ) The following points are to be noted: 1. More detailed theoretical treatments gave rise to the nucleation controversy. The nucleation rate, i.e. the rate at which large droplets of liquid are formed from the vapour.phase, was calculated in a more sophisticated manner than in the classical theory of Becker and Döring ( 2 ) and Zeldovich ( 3 ), but the results of different authors ( 6 ' 7 ) were at variance by a factor of order 10 17 . At the same time this raised questions concerning the agreement between theory and experiment. 2. Recent experiments ( 8 ) are in essential agreement with the nucleation rates predicted by the classical theory. 3. Computer calculations of the thermodynamic properties of small droplets of about 100 particles are becoming available ( 9 ' 1 0 ). The above mentioned nucleation controversy may well be settled most conclusively on the basis of these numerical calculations. We shall not attempt to solve here any of the difficult problems raised in the theory, but merely present a brief outline of its essential elements. Consider a gas of identical particles, mass m, in thermal equilibrium in volume V at pressure P, temperature T, or equivalently, chemical potential p, temperature T. The droplet model of fluids received much inspiration from the Mayer cluster theory of the classical real gas. ( n ) One was tempted to assume the equilibrium number density of ß-droplets to be proportional to the Mayer cluster-coefficients b^(T). This, however, leads to difficulties because the coefficients may be negative on account of the repulsive part of the interactions. Thus one is forced to start from a definition of physical droplets. An ß-cluster or ß-droplet is defined as a configuration of precisely ß particles in which each of the particles is within a certain cluster range d of at least one other particle. The range d may be chosen roughly equal to the range of interaction. As has been shown by Stillinger ( 12 ) it follows rigorously from the grand canonical ensemble of equilibrium statistical mechanics that the number density of ß-clusters is given by n f t o T) = z \ ( ß , T)/V 294
(2.1)
where z = exp j3ju/A3 is the activity, with 0 = l/k B T and A = (h 2 /27rmk B T) 1/2 the de Broglie wavelength. The partial partition function of 6-droplets Q^Gu, T) is defined by Q x (/i, T) =
J • • • Jexp
U £ (R £ ) - 0 Wg(Rg, n, T)] d j . . . d £
(2.2)
£-cluster where Rj> s ( " r ^ l ^ , . . . ,1^) is a 3£-dimensional vector specifying the cluster configuration, Ufc(Rg) is the interaction energy between £ particles, e.g. a sum of pair interactions, and where W() (R|, ju, T) is the thermodynamic work necessary to evacuate the cluster space C(Rg) corresponding to the configuration R^. This work may in principle be calculated as the difference of two grand potentials 0 W^Rg, n, T) =
T) -
n, T)
(2.3)
where ^(jj., T) = In Z gr is the logarithm of the grand partition function for volume V and ^ ( R ^ , m, T) its analogue when the cluster space C(Rg) is made inaccessible to the particles. In the thermodynamic limit V for a reasonable sequence of domains, one expects Wg (R^, ¡i, T) to become independent of the center of mass coordinates. In first approximation it will be equal to W^Ri./x.D^PvO^)
(2-4)
where P(ju, T) is the pressure and v(R^) the volume of the cluster space C(R^). The next approximation will be a surface term. We introduce cluster potentials ^ by the definition n?(/i,T) = n0exp[-U^(iz,T)]
(2.5)
where n 0 (fz, T) is the average number density. From (2.1) and (2.2) it follows that the i^g may in principle be calculated from a cluster partition function. In the gas phase one may expect ^ to be a monotonic increasing function of £ with the result that small clusters heavily predominate. The large majority of the particles will be in the monomer state: n f > n^q for £ > 2. The droplet theory of condensation is based on an Ansatz for the behavior of the potentials T) for large values of £ namely T) = £(/i„(T) - v) + aAi(n, T) + r In £ + 0(1)
(2.6)
where /j a (T) is the value of the chemical potential at condensation, a is the surface tension, and A¡(p., T) is a mean surface area of £-droplets. At low temperatures the droplets in the main will be spherical so that one may put A £ (/x,T) i *(127rv L )M
(2.7)
where v L (T) is the volume per particle in the liquid phase at condensation. On the other hand Fisher ( 13 ) has argued that near the critical point other shapes will frequently occur. Moreover the interference between clusters, expressed by the potential W1(R£, ¡1, T), will also be more important. Hence Fisher puts more generally AjOi.T^aoB"
(2.8) 295
with an exponent a to be determined. It is then shown that (2.6) leads to scaling in the critical region with critical exponents determined by the parameters o and T. Conversely, numerical estimates of the critical exponents for the 3-dimensional lattice gas lead to A = 0.6153 and T = 2.192. The classical analytic behavior of the thermodynamic functions in the critical region would correspond to a = § and r = | . Nucleation theory deals with the rate of condensation of large droplets when the fluid is in a metastable state. Experimentally metastable states may be achieved quite easily, e.g. in a Wilson chamber by expanding the vessel adiabatically. Thermodynamically metastable states are well-defined and characterized by chemical potential ju, temperature T and pressure P(/i, T) lower than the corresponding true equilibrium pressure. The reason for the existence of these states is that the number densities n^ of C-droplets can change only slowly and a potential barrier exists for the formation of large droplets. For the rate of change of the densities
a simple random walk model is used (2.9)
That is, because the overwhelming majority of the particles is in the monomer state, droplets are assumed to grow by assimilation of single particles with a growth rate g(£) depending on droplet size. Thus coagulation of droplets is considered rare and is neglected. ( 1 4 ) The growth rate g(£) is estimated from gas kinetic theory to equal
(2.10) where the condensation coefficient a is the probability that a particle hitting an £droplet will stick. The evaporation rate r(C) is calculated from a detailed balance relation r(g)ne/> = § ( 8 - 1 ) 0 ] ^
(2.11)
where for states in the two-phase region the superscript eq now refers to the metastable "equlibrium" state. The densities are again defined by (2.1) and (2.2) but the work W € ( R f , n, T) is to be evaluated in the metastable state. From a thermodynamic point of view this quantity is well-defined but a statistical mechanical definition is less clear-cut. Following van Kampen'% work ( 1 S ) on the_van der Waals gas one might calculate partial partition functions T) and Zg/Rg, n, T) by excluding all those configurations in which the occupation of suitably chosen volume cells differs from the average more than allowed by certain bounds. This point of view is supported by numerical calculations of Hansen and Verlet ( 1 6 ) who found the complete van der Waals loop by imposing such a spatial homogeneity restriction. From the approximation (2.4) the necessity of using the metastable state parameters is evident. In magnitude the Wg -term in (2.2) is relatively small and it is usually neglected.
296
i Fig. 1 Sketch of the behavior of the potentials for the gas phase (JJ M n a the first term in (2.6) makes ^ negative for large G. As a consequence the potentials show the behavior sketched in Fig. 1. For small values of £ the ^ are essentially the same as in the gas phase. At some value fi* the reach a maximum after which they de-, crease and become negative. The calculations are somewhat simplified by approximating the random walk (2.9) by a diffusion equation (2.12a)
(2.12b) where £ is now regarded as a continuous variable and where g(£) plays the role of an C-dependent diffusion coefficient. Thus (2.12b) is essentially the Smoluchowski equation for diffusion in a potential field used by Kramers ( 1 7 ) in his theory of reaction rates. After a very short time a steady state is reached with a constant current J s trickling across the top of the potential barrier where (2.13) Solving this differential equation with the boundary condition n st (°°) = 0 one finds for the steady state distribution
(2.14)
297
The current may be calculated by assuming a steady replenishment of monomers. Setting n s t ( l ) = n e i ( l ) one finds from (2.14) J s _1 = | [ g ( C ) n e q ( C ) ] - 1 d £ .
(2.15)
The integrand is sharply peaked at the location £ = £* of the maximum of >p(9.) and the integral may be approximately evaluated by a saddle-point calculation. Hence one finds
Js~Z(£*)g(£*)ne(£*) where the Zeldovich factor Z(£*) is given by (3> Z(£) =
1
V2n
0- d£
(2.16) 18
) (2.17)
Hence the nucleation rate J s is determined entirely by the height and the width of the maximum in the potential i/j(£). For £ < £* the steady state number density n s t (£) is practically equal to net>(£) and it decreases to zero rapidly for £ > £*. The approximations made in replacing the discrete set of £-values by a continuum and in the choice of boundary conditions give rise to negligible errors, as has been checked in detail by White.(}9) On the contrary the numerical value for the nucleation rate is very sensitive to the precise expression used for ty . In nucleation theory (2.7) is generally accepted but a controversy has arisen over the in 2 and 0 ( 1 ) terms in (2.6). In the classical theory of Becker and Doring ( 2 ) these terms were absent altogether. Later refinements of the theory led to a variety of t-values: Frenkel ( 1 8 ) finds t = - 4, Kuhrt ( 2 0 ) r = - 4 , Lothe and Pound ( 6 ) T =-
Reiss and Katz (7) r = 1, Feder, Lothe and Pound ( 5 ) x = - 4, Reiss, Katz and Cohen (21)t = -^, Stillinger ( 22 ) x = 0.95,Parlange ( 2 3 ) t = f , and Kuni andRusanov ( 2 4 ) T = - \ .
Frenkel ( 1 8 ) and Kuhrt ( 2 0 ) were the first to note the contribution to the droplet partition function (2.2) from the rotational degrees of freedom of the droplet considered as a rigid sphere. Lothe and Pound ( 6 ) took up this idea but modified the estimate of the correction corresponding to the decrease in the number of internal degrees of freedom because of the translation and rotation of the droplet as a whole. The difference in the 0 ( 1 ) terms yielded a value for the nucleation rate J s differing by a factor 10 17 from the classical value. Contrariwise Reiss, Katz and Cohen (7'21) estimated the main contribution to the cluster partition function Q^ in (2.2) to originate from a collective vibration mode and found values for J s much closer to the classical ones. In our opinion neither of these calculations can be regarded as fully satisfactory. A useful guideline for a more complete theory might be found in the recent computer calculations ( 9 ' 1 0 ) of free energies of small droplets of up to ± 100 particles. These calculations refer to droplets in the solid state, but the arguments of the above-mentioned authors equally apply to that case and may be put to a test.
298
One result of these calculations is the jagged appearance of the function if(£) for values in the range 2 < £ ^ 100. The nucleation rate J s is of course rather insensitive to the detailed behavior of (8) for small as follows from (2.16), and it may still be possible to employ the fact that £* is rather large (of the order 100 or larger in experiments). In the comparison with experiment one usually makes the additional approximation a
(2.18)
corresponding to ideal gas behavior in the metastable phase. In recent experiments Katz ( 8 ) has obtained curves of supersaturation ratio S = P/P 0 versus T at fixed nucleation rate J s for a number of fluids. He found good agreement with the classical predictions using only the first two terms in (2.6) with (2.7). Later refinements of the theory decreased agreement with experiment. Present-day interest in the theory of the critical point makes it desirable to examine the validity of the theory for that regime. As noted before the potentials ^ ( M , T) are expected to behave differently because the droplets will deviate more frequently from spherical shape and because of cluster interference effects. Simultaneously one would expect coagulation to become more important so that the simple random walk model (2.9) will no longer be sufficient.
3. The Stochastic Ising-model Extensive studies in equilibrium statistical mechanics of Ising spin systems have yielded a wealth of interesting results. The 2-dimensional Ising-model is one of the few exactly soluble models showing a phase transition. ( ' ) In 3 dimensions the partition function cannot be calculated exactly but the simplicity of the system allows one to use series expansions and obtain numerical results on critical behavior. ( 2 S ) Although non-equilibrium problems are intrinsically more difficult one may hope that the simplicity of Ising-systems may be used with similar profit for the study of irreversible behavior. Since the classical Ising-system is not described by a Hamiltonian one is forced to use a stochastic approach from the start. Let % = (s i, s 2 , . . . , SJSJ) denote a spin configuration of the whole system, where Sj can take the two values +1 and - 1 . With each spin configuration an energy E("sN ) is associated of magnitude (3.1) < U >
where the first sum is over nearest neighbors in a d-dimensional lattice, J is an interaction energy, and H a magnetic field. Thermal equilibrium is described by the canonical probability distribution exp[-gE(sN)] Peq(%) =
ZN(0,H)
(3.2)
299
where ZN()3, H) is the partition function ZN(0,H)=2]exp[-0E (*)]. * S
(3.3)
N
Non-equilibrium states of the system are specified by a probability distribution P( t). We postulate that spin configurations have a certain probability to change per unit time and that the approach to thermal equilibrium is described by a master equation 3P
3tSN,t> = 2 [ W ( î N , " ^ ) P ( % , t ) - W ( ^ , î N ) P ( ? N > t ) ] . tN
(3.4)
The transition probabilities W( %,'s'n) may be thought to originate from the interactions with a heat bath. In order to assure relaxation to the thermal equilibrium distribution (3.2) they must satisfy certain conditions. Provided every spin configuration can be carried into any other configuration by successive transitions a sufficient condition for the approach to thermal equilibrium is the detailed balance relation W(
,
Peq(^) =
, ?N) Peq(îN).
(3.5)
This still leaves one much freedom in the choice of kinetics compatible with the equilibrium statistical mechanics. Glauber ( 2 6 ) has proposed a simple model in which the only allowed transitions are flips of individual spins with probabilities depending on the state of its neighbors and on temperature and magnetic field. The explicit expression for the transition probabilities is N
W ( î r i , î N ) = 2 w j ( î N ) Ô ( | s ] - s j | - 2 ) JJ 6 ( S k - s k ) j=1 k =/=j
(3.6)
where 5(s) = S s 0 and w j ( s n ) is given by w
j(sN) = \
1
~ Sj tanh (0 J ^ s k + 0 H) k(j)
(3.7)
where k(j) denotes a nearest neighbor of site j and X is a rate constant. In the lattice gas interpretation of the Ising-model, where Sj = + 1 is interpreted as occupation of site j by a particle and Sj = - 1 as an empty site, the magnetic field plays the role of the chemical potential n, with H -+ - 00 corresponding to the ideal gas limit. A model closer to the kinetics treated in the preceding section would be a 2-flip model in which pairs of neighbors flip simultaneously. Such a model would enable one to study the statistical foundations of nucleation theory in much greater detail. This would be of particular interest near the critical point. So far most attention has been given to the 1-flip Glauber model which is more adapted to the magnetic interpretation. In that case the transition probabilities (3.7) may be related rather naturally to a spin-phonon interaction. 300
For the Glauber model a number of exact and numerical results are available. Unfortunately exact results have been found only in one dimension where the equilibrium system has no phase transition. Glauber ( 26 ) showed that in one dimension for H = 0 the expectation values of individual spins m^t) = t satisfy a simple equation 8m,
i i = -Xicmj.!+-XKmi+1-Xmi(
(3.8)
where k = tanh 2j3 J. This is a random walk with absorption and Eq. (3.8) is easily solved in terms of Bessel functions. The total magnetization M(t) = 2 rrij(t) decays i exponentially with rate constant X(1 - k). Similarly one finds the second moments t from a two-dimensional random walk with absorption. Bedeaux, Shuler and Oppenheim ( 27 ) solved the corresponding equations for a set of correlation functions defined as nonlinear combinations of higher order spin averages. The complete solution of the master equation (3.4) in the one-dimensional case with (3.6), (3.7) and H = 0 was given by the author. ( 2S ) In systems which are thermodynamically close to a critical point the transport processes are appreciably different from behavior near states well in the one-phase region. The usual transport equations lose their validity and at present no satisfactory theory of irreversible behavior near a critical point exists. The Glauber model offers the possibility of studying the kinetics near the critical point for a simple system of which the equilibrium properties are well known. Various approximate methods ( 29 ) have been used to study the critical behavior in both 2 and 3 dimensions. Numerical studies of the effect of critical slowing down have been made by Suzuki and Yahata.(30) In particular they have studied the time correlation functions of energy and magnetization by means of high temperature series expansions. The energy-energy correlation function is defined as = 2 2 ] - < E > ) ( E ( ? N ) -) •*i * S
N
S
\tN,t)Peq(tN)
(3.9)
N
where the pointed brackets indicate averaging over the thermal ensemble (3.2) and where the conditional probability P(s^ | % , t) for the system to be in the configuration % at time t when starting from sn at time 0 is found as a particular solution of the master equation (3.1). The magnetization-magnetization correlation function (5M(t)5M> N is defined in similar fashion with the total magnetization M( Sn) = 2 S; replacing E( s N ). Characteristic relaxation times rm and r E may be i=l defined ( 31 ) by f , m " J ((SM?) d t o
T
? d t "
(310)
301
These relaxation times are expected tb diverge at the critical point with singular behavior expressed as TE~e-AE
(3.11)
where e = (T - T c )/T c (for simplicity we consider only T > T c ). The classical theory would ascribe this singular behavior entirely to free energy effects. Thus TM would be expected to diverge as the susceptibility x, and r E as the specific heat Ch • The susceptibility diverges as x ~ e~ 7 , with y = 1.75 for the 2dimensional square lattice from Onsagers exact solution. Numerical estimates from series expansions ( 2 5 ) indicate y = 1.75 for all 2-dimensional lattices (square, triangular, honeycomb), and y = 1.25 for all 3-dimensional lattices (s.c., b.c.c., f.c.c. and tetrahedral). Similarly the specific heat shows a logarithmic singularity CH ~ | In e| in two dimensions and C H ~ e~a with a — 0.125 in three dimensions. Yahata (30) has found A M ^ 2 for the square lattice and A M ^ 1.4 for the simple cubic lattice, both for vanishing magnetic field. The exponent A E is estimated as A e — 2 for the square and triangular plane lattice. These results indicate that the critical slowing down is non-classical in this model. The critical exponents A M and A e are conjectured to be independent of the lattice structure and to change only with dimensionality, as in the case of the thermodynamic properties. More generally one expects the exponents to be independent of the details of the microscopic kinetics as well. The latter conjecture has been confirmed in a recent study by Suzuki and the author ( 3 2 ) of a class of relaxation models for the linear Ising chain. In this case the energy of a spin configuration is N
N
i=i
j=i
where we assume cyclic boundary conditions Sn + 1 = S j. Although there is no phase transition the free energy per spin has a singularity at (T = 0, H = 0) and this point in many ways acts as a critical point. As mentioned before, for H = 0 the master equation for Glaubers 1 -flip model can be solved exactly in one dimension. More generally we have studied the n-flip model with n arbitrary. In the n-flip model the only allowed transitions are those in which n successive spins flip. The transition probabilities now read explicitly N
j-l
j+n-l S
j =l
n 0k k=1
_s
k) n 6(|s;-s,|-2) 1=j
N JJ 5 ( s ^ - s m ) m = j + n (3 13)
with Wj(s^) = | A [ l - | s j t a n h 2 / 3 J s j _ 1 - ^ s j + n - ! tanh20J s j + n ] and cyclic boundary conditions. 302
(3.14)
The correlation f u n c t i o n s and (5 E ( t ) 6 E> have b e e n e v a l u a t e d e x a c t l y in the limit N -*• °° for all n. T h e relaxation t i m e s r M ( n ) and r E ( n ) o f c o u r s e d e p e n d o n the m o d e l b u t their singular behavior near T = 0 is given b y ?M(n)~Tr2,
rE(n)~7T2
(3.15)
in t e r m s o f the natural e x p a n s i o n parameter 17 = e x p ( - 2 0 J). Again t h e s l o w i n g d o w n is non-classical since the susceptibility diverges as x ~ V'1
| In 77 j, w h i l e t h e s p e c i f i c
heat t e n d s t o z e r o as C H ~ r j | l n 7 j | 2 . The e x a c t results in o n e d i m e n s i o n are o f interest in their o w n right in c o n n e c t i o n w i t h such o n e - d i m e n s i o n a l statistical m e c h a n i c a l s y s t e m s as l o n g p o l y m e r chains. In a d d i t i o n it is h o p e d that t h e y will provide a u s e f u l starting-point f o r the s t u d y o f the s t o c h a s t i c Ising-model in t w o and three d i m e n s i o n s .
References L. Onsager,
Phys. Rev. 65, 117 (1944).
R. Becker and W. Döring, J. Zeldovich,
Ann. d. Physik (5) 24, 719 (1935).
J. E. T. P. (U.S.S.R.) 12, 525 (1942).
C. T. R. Wilson, Phil. Trans. A189, 265 (1897); C. F. Powell, Proc. Roy. Soc.A119, 553 (1928); M. Volmer and H. Flood, Z. Phys. Chem. A170, 273 (1934). See reviews by J. Feder, K. C. Russell, J. Lothe and G. M. Pound, Adv. Phys. 15, 111 ( 1 9 6 6 ) \ P . P. Wegener, Non-equilibrium Flows, part I, ed. P. P. Wegener (Dekker, New York, 1969), Chap. 4. J. Lothe
and G. M. Pound,
H. Reiss and J. L. Katz, / . L. Katz,
J. Chem. Phys. 36, 2080 (1962). J. Chem. Phys. 46, 2496 (1967).
J. Chem. Phys. 52, 4733 (1970).
J. J. Burton,
Chem. Phys. Lett. 7, 567 (1970), J. Chem. Phys. 52, 345 (1970).
F. F. Abraham
and J. V. Dave,
J. E. Mayer and M. G. Mayer,
Chem. Phys. Lett. 8, 351 (1971). Statistical Mechanics (John Wiley, New York, 1940)
Chap. 14. F. H. Stillinger,
Jr., J. Chem. Phys. 38, 1486 (1964), J. Chem. Phys. 47, 2513 (1967).
M. E. Fisher, Physics 3, 255 (1967). J. L. Katz,
H. Saltsburg and H. Reiss,
N. G. van Kampen,
J.-P. Hansen and L. Verlet, H. A. Kramers, J. Frenkel,
Phys. Rev. 184, 151 (1969).
Physica 7, 284 (1940).
Kinetic Theory of Liquids (Oxford University Press, Oxford, 1946) Chap. VII.
G. M. White, F. Kuhrt,
J. Colloid. Interfaces Sei. 21, 560 (1966).
Phys. Rev. 135, 362 (1964).
J. Chem. Phys. 50, 4672 (1969).
Zeits. Phys. 131, 185 (1952).
303
(21)
H. Reiss, J. L. Katz and E. R. Cohen,
C22) C23)
F. H. Stillinger, Jr., J. Chem. Phys. 48, 1430 (1968). J.-Y. Parlange, J. Chem. Phys. 48, 776 (1968).
O (2S)
F. M. Kuni and A. I. Rusanov, Physics Lett. 29A, 337 (1969). M. E. Fisher, Rep. Ptogr. Phys. 30, 615 (1967).
C6) C27) C28) i29) C30)
R. J. Glauber, J. Math. Phys. 4, 294 (1964). D. Bedeaux, K. E. Shuler and I. Oppenheim, J. Stat. Phys. 2, 1 (1970). B. U. Felderhof, Rep. Math. Phys. 1, 215 (1970). For an extensive list of references see réf. ( 2 Ï ). H. Yahata and M. Suzuki, J. Phys. Soc. Japan 27, 1421 (1969); H. Yahata, J. Phys. Soc. Japan 30, 657 (1971). M. Suzuki, Progr. Theor. Phys. 43, 882 (1970). B. U. Felderhof and M. Suzuki, to be published.
(31) i32)
304
J. Chem. Phys. 48, 5553 (1968).