272 75 18MB
Swedish Pages [356] Year 2002
Kerstin Vännman
Matematisk statistik
~ Studentlitteratur
00
KOPIERINGSFÖRBUD
Detta verk är skyddat av lagen om upphovsrätt. Kopiering, utöver lärares rätt att kopiera för undervisningsbruk enligt BONUS-Presskopias avtal, är förbjuden. Sådant avtal tecknas mellan upphovsrättsorganisationer och huvudman för utbildningsanordnare t.ex. kommuner/universitet. För information om avtalet hänvisas till utbildningsanordnarens huvudman eller BONUS-Presskopia. Den som bryter mot lagen om upphovsrätt kan åtalas av allmän åklagare och dömas till böter eller fängelse i upp till två år samt bli skyldig att erlägga ersättning till upphovsman/rättsinnehavare. Denna trycksak är miljöanpassad, både när det gäller papper och tryckprocess.
Art.nr 3218 ISBN 91-44-01690-5 © Kerstin Vännman och Studentlitteratur 1990, 2002 Andra upplagan Illustrationer: Andrejs Dunkels Omslagslayout: Henrik Hast
Printed in Sweden Studentlitteratur, Lund Webbadress: www.studentlitteratur.se Tryckning/år 5 6 7 8 9 10
2006
Innehåll 1
2
3
4
Slumpmässig variation 1.1 Inledning . . . . . . . . . . . . . . . . . . 1.2 Några exempel på slumpmässig variation. 1.3 Beskrivande statistik . . . . 1.3.1 Litet material . . . . . 1.3.2 Grupperat material .. 1.3.3 Klassindelat material . 1.3.4 Avslutande kommentar 1.4 Explorativ dataanalys . . . .
1 1
2 7 8 11
14 21
25
Några grundläggande begrepp 2.1 Sannolikheter . . . . . 2.2 Betingad sannolikhet . 2.3 Oberoende händelser
39 39 55
Diskreta fördelningar 3.1 Diskreta stokastiska variabler . . . . . . . . . . 3.2 Några ofta förekommande diskreta fördelningar 3.2.1 Den likformiga fördelningen . . . . . 3.2.2 Den hypergeometriska fördelningen . 3.2.3 Binomialfördelningen . 3.2.4 Poissonfördelningen .. 3.3 Väntevärde . . . . . . . . . . . 3.4 Varians och standardavvikelse .
73 73
Kontinuerliga fördelningar 4.1 Kontinuerliga stokastiska variabler . . . . . . . . . . 4.2 Några ofta förekommande kontinuerliga fördelningar 4.2.1 Rektangelfördelningen . 4.2.2 Exponentialfördelningen 4.2.3 Weibullfördelningen 4.2.4 Normalfördelningen iii
62
82 82 82 83
85 91
97 103 103 111 111 113 115 115
INNEHÄLL
iv Väntevärde . . . . . . . . . . . . Varians och standardavvikelse . . Andra läges- och spridningsmått
121 125 129
5 Väntevärde och varians för funktioner ... 5.1 Oberoende stokastiska variabler . 5.2 Linjära funktioner och summor 5.3 Om mätfel . . . . . . . . . . . 5.4 Gauss approximationsformler
135 135 136 143 148
6 Normalfördelningen 6.1 Allmänna egenskaper ... 6.2 Summor av normalfördelade .. . 6.3 Centrala gränsvärdessatsen .. . 6.3.1 Halvkorrektion . . . . .
155 155 159 165
7 Punktskattningar 7.1 Inledning . . . . . . . . . . . . . . . 7.2 Punktskattningars fördelning . . . . 7.3 Väntevärdesriktighet och effektivitet
177 177 180 181
8 Intervallskattning 8.1 Teckenintervall . . . . . . . . . . 8.2 Konfidensintervall förµ i N(µ, er) 8.2.1 er känt . . . . . . . . . . . 8.2.2 er okänt . . . . . . . . . . 8.3 Jämförelser mellan två väntevärden .. . 8.3.1 Stickprov i par . . . . . . . . . 8.3.2 Två stickprov . . . . . . . . . . 8.4 Konfidensintervall för er 2 och er i N(µ, er) . 8.5 Hur gör man om man inte har normalfördelning?
193 193 199 199 202 210 210 212 220 225
9 Hypotesprövning 9.1 Enkla hypoteser. . . . . . . . . . . . . . . . . . . . 9.2 Sammansatta mothypoteser vid normalfördelning . 9.2.1 Test avµ, då er är känt . . . . . . . . . . . 9.2.2 Test avµ då er är okänt . . . . . . . . . . . 9.3 Samband mellan konfidensintervall och hypotesprövning... 9.4 Sammansatta mothypoteser vid binomialfördelning 9.5 Teckentest . . . . . . . . . . . . . . . . . . . . . . 9.6 Hur gör man om man inte har normalfördelning?
231 231 237 237 244 251 254 258 263
10 Fördelningspapper och x2-test 10.1 Fördelningspapper . . . . . .
267 267
4.3 4.4 4.5
© Studentlitteratur
171
INNEHÄLL
V
10 .1.1 Rektangelfördelningspapper . . 10 .1. 2 Exponentialfördelningspapper . 10.1.3 Normalfördelningspapper ... 10.1.4 Några avslutande kommentarer 10.2 x2-test . . . . . . . . . . . . . . . . . . 10.2.1 Fo fullständigt känd . . . . . . 10.2.2 Fo beroende av okända parametrar .
267 270 274 277 278 278 282
11 Blandade övningar
285
Appendix A Tabeller Grekiska alfabetet Binomialfördelningen . Poissonfördelningen Normalfördelningen Normalfördelningen (forts.)
300 301 301 302 307 309 310 311 312
t-fördelningen . x2 -fördelningen
313
B Svar
©
Studentlitteratur
Förord Detta är en omarbetning av den tidigare läroboken med samma namn. Den största förändringen gäller layouten. Innehållsmässigt har inga större förändringar skett. Det har tillkommit ett kort avsnitt om explorativ dataanalys. och det tidigare avsnittet om slumptal har utgått. Texten har på vissa ställen omarbetats för att bättre passa den nya layouten. Exempel och övningar är dock i stort sett oförändrade. Det innebär bland annat att de övningar och exempel som handlar om pengar inte stämmer med dagens nivå utan snarare med början av åttiotalets. Detta får ses som kuriosa. Boken är i första hand riktad till studenter inom utbildningarna för civiloch högskoleingenjörer, men är även lämplig för annan högskoleutbildning eller för självstudier. Den innehåller många exempel och övningar. Övningarna finns dels efter varje avsnitt i kapitel 2-9 och dels i ett sista kapitel där övningar av olika svårighetsgrad har blandats. Jag vill rikta ett varmt tack till alla mina kollegor vid Luleå tekniska universitet (tidigare Högskolan i Luleå), som varit med vid tillkomsten av de första upplagorna av boken. Ett stort tack riktas också till Mikael Möller, på 'IEX-Försäljning AB. Utan hans tålmodiga handledning igenom datorprogrammets snårigheter hade denna upplaga inte blivit till. Denna bok tillägnar jag min favoritkollega och älskade make Andrejs Dunkels, som avled 1998. Han var min stora inspirationskälla, diskussionspartner och ett stort stöd under utarbetandet av de tidigare upplagorna. Dessutom satte han mig in i layoutens intressanta värld och har ritat figurerna och fotisarna i den här boken. Hans minne kommer alltid att leva vidare i denna bok, som vi just hade påbörjat omarbetningen av då han helt oväntat ryktes bort. Sörmjöle augusti 2002 Kerstin Vännman
1. Slumpmässig variation
1.1
Inledning
Inom industrin, ingenjörs- och naturvetenskapen stöter man ofta på situationer där slumpmässiga förändringar och slumpmässig variation förekommer. Exempelvis om man undersöker hållfasthet hos betongbalkar, stålbalkar, papper och berg buller vid arbetsplatser och löpande band, i maskinhallar och gruvor livslängd hos kugghjul, lager, elektroniska komponenter och bergborrningsmaskiner nederbörd, snösmältning och vattenstånd bergkroppars egenskaper och malmers kvalitet kvalitet av tillverkat och inköpt material spridning av damm och föroreningar i arbetslokaler. När man arbetar med situationer med slumpmässig variation behöver man använda statistiska metoder för att man skall kunna dra slutsatser, uppskatta risker och fatta objektivt grundade beslut. Eftersom slumpmässig variation förekommer så ofta så är inte frågan om den yrkesverksamma ingenjören kommer att använda statistiska resonemang utan istället hur pass bra hon/han kommer att göra det. Den här boken syftar därför till att träna det statistiska tänkandet så att man kan förstå och använda några enkla statistiska metoder.
Arr
TÄNKA
RÄ.Tr ÅR
ATT~ 'FRl'rt' ÄR
Å1T 'OOIKÅ $rATI5T~KT
~'IÖRRl:.
ÄR
1
STÖR$T.
2
1.2.
1.2
Några exempel på slumpmässig variation
Några exempel på slumpmässig variation
Exempel 1.1 En firma tillverkar mätapparatur till vilken behövs elektroniska kretskort. Det blir dyrt om man får in för många defekta kretskort i produktionen. Man har därför en bötesklausul inskriven i köpekontraktet. Den träder i kraft om sändningen innehåller mer än 1% defekta kretskort, dvs om felkvoten är större än 0.01. För att kontrollera om bötesklausulen behöver utnyttjas har man en mottagningskontroll. Kretskorten ligger i förpackningar med 10 000 i varje. Man tar 200 kort på måfå ur varje förpackning och kontrollerar dem. I en sändning på 80 förpackningar fick man följande resultat. Tabell 1.1 Antal defekta kretskort bland 200 utvalda i 80 förpackningar.
1 1 5 5
2 2 1 2
1 2 3 2
0 2 3 4
3 2 1 1
3 2 1 3
4 2 3 3
2 5 2 0
4 2 1 0
7 2 4 1
4 3 2 2
1 5 1 4
1 1 3 3
0 2 2 2
1 4 1 3
0 2 1 0
1 0 4 1
0 1 3 1
0 4 1 1
4 1 3 1
Antalet defekta kretskort varierar mellan O och 7. Vad kan vi säga om felkvoten i sändningen? Kan vi kräva att bötesklausulen skall träda i kraft? Hur pass säkra uttalanden kan vi göra om felkvoten? Exempel 1.2 Ett Geiger-Mtiller rör utsätts för strålning från ett radioaktivt preparat med lång halveringstid. Man mäter antalet pulser under 5 sekunder. Detta förfarande upprepas många gånger. En typisk följd av mätvärden är 3, 1, 5, 4, 2, 2, 6, . . . . En serie av 200 mätningar gav följande resultat sammanställt i en frekvenstabell. Tabell 1.2 Frekvenstabell över antalet pulser per 5 sekunder.
Antal pulser
0
1
2
3
4
5
Frekvens
3 19
32
44
35
21
Relativ frekvens
(%)
6
7
8
9 10 Total
23 11
8
3
1 200
1.5 9.5 16.0 22.0 17.5 10.5 11.5 5.5 4.0 1.5 0.5 100
Kan vi utgående från detta material säga något orri det genomsnittliga antalet pulser per tidsenhet för preparatet? Om vi i förväg vet det genomsnittliga antalet pulser per tidsenhet för preparatet kan vi då säga något om hur vår frekvenstabell kommer att se ut efter många mätningar? Med andra ord, kan vi med någon modell beskriva ©
Studentlitteratur
1. Slumpmässig variation
3
hur antalet pulser per tidsenhet kommer att variera när vi gör en lång serie mätningar? Exempel 1.1 och exempel 1.2 är typiska exempel på slumpmässig variation. Om vi betraktar försöket att registrera pulser per tidsenhet (exempel 1.2) och kallat registreringen under en tidsenhet för ett delförsök så kan vi inte förutsäga resultatet i ett visst delförsök. Detsamma gäller i exempel 1. 1. Vi kan inte i förväg tala om hur många defekta kretskort vi kommer att få. Däremot finns en viss regelbundenhet som visar sig om vi gör tillräckligt många delförsök. Detta gör att vi så småningom kan finna en modell för att beskriva försöket. Den modellen skall då beskriva den slumpmässiga variation som kan förekomma och kallas därför slumpmässig modell. Ett annat namn är stokastisk modell. Ett av de allra enklaste och mest renodlade exemplen på slumpmässig variation är slantsingling. Om vi singlar ett symmetriskt mynt så kan vi inte förutsäga resultatet för varje enskilt kast. Men intuitivt tycker vi att i långa loppet bör vi få lika många krona som klave. Om vi låter 0 beteckna klave och 1 beteckna krona så bör en serie av slantsinglingar ge en slumpmässig följd av 0:or och l:or och efter ett stort antal kast bör relativa frekvensen för 0:or närma sig 1/2 och detsamma för l:or. Detta är ett exempel på en enkel slumpmässig (eller stokastisk) modell. Vi betraktar ytterligare några exempel där slumpmässig variation förekommer. Exempel 1.3 Ett försök gick ut på att bestämma höjden h av ett visst rätblock. Till detta användes skjutmått. Man gjorde 10 mätningar. Tabell 1.3 Resultat (i mm) av 10 mätningar av höjden h.
12.3
12.3
12.2
12.1
12.4
12.2
12.5
12.3
12.1
12.3
Vi ser att mätvärdena varierar. Vilket värde är bäst som uppskattning av höjden? Hur skall precisionen anges? Mätsituationen i exempel 1.3 kan beskrivas med en enkel slumpmässig modell genom att betrakta varje mätvärde som summan av den sanna höjden h och ett slumpfel. Vi skall längre fram se vilka egenskaper det slumpmässiga felet kan ha. Exempel 1.4 I Grängesberg gjordes 1968 ett fullskaleprov för att studera en skopas inträngning i en bergshög med och utan vibrationer. Man använde lastmaskin LM 56H för att fylla en 2 m3 vagn med malm. Antal skoptag per vagn noterades och man fick följande resultat. Se tabell 1.4 och 1.5. © Studentlitteratur
4
1.2.
Några exempel på slumpmässig variation
Tabell 1.4 Antal skoptag per vagn utan vibration.
Antal skoptag Frekvens
7 1
8 4
9 13
10 31
11
24
12 22
13 19
14 4
15 2
16 4
15 3
16 2
Tabell 1.5 Antal skoptag per vagn med vibration.
Antal skoptag Frekvens
7 3
8 11
9 17
10 18
11
36
12 25
13 15
14 5
Antal skoptag per vagn varierar mellan 7 och 16 i båda fallen. Vad är genomsnittliga antalet skoptag? Kan man påstå att det föreligger skillnader mellan de båda metoderna? Exempel 1.5 Fortsättning på exempel 1.4. Man noterade även tiden från det att maskinen började köra in i bergshögen till dess att lasta.ren kopplade loss vagnen från lastmaskinen. Se tabell 1.6. Vad är den genomsnittliga tidsåtgången när man lastar med vibration? Hur mycket kan tiden variera? För hur stor andel av vagnarna kan man tänka sig att tiden överskrider 2 min? Vilken tid kan man räkna med att 95% av vagnarna underskrider? Tabell 1.6 Tidsåtgången (i minuter och sekunder) vid lastning med vibration.
1.25 1.18 2.35 1.19 2.02 1.36 1.23 1.44 1.57 1.53 1.58 1.31
1.20 1.24 2.33 1.34 2.09 1.56 1.39 2.33 1.50 1.36 1.50 1.59
1.25 1.20 2.08 1.51 1.13 2.08 2.20 2.14 2.29 1.46 1.31 1.58
1.17 1.34 2.52 1.51 1.15 1.26 1.19 1.22 1.59 1.47 2.06 1.55
1.41 1.44 1.09 1.58 1.51 1.20 1.18 1.31 2.01 1.48 1.37
1.49 1.36 1.24 2.13 1.36 1.37 1.27 1.44 1.54 2.08 2.01
1.51 1.40 1.39 2.20 2.06 1.58 1.47 2.08 1.56 1.50 1.47
1.49 1.57 1.50 1.20 2.27 2.04 2.14 1.16 2.10 1.49 1.44
2.28 1.52 1.52 1.24 1.30 2.30 2.20 1.48 1.30 1.25 2.09
3.03 1.43 3.01 1.40 1.43 1.36 1.19 2.21 1.37 1.35 1.46
2.33 2.02 2.56 1.41 1.40 1.45 1.27 2.14 2.07 1.56 1.52
Exempel 1.6 Från 1000 lager valde man slumpmässigt ut 5 och testade livslängden av dessa. Se tabell 1.7. Livslängden tycks variera mycket. Hur skall vi kunna beskriva livslängden hos alla 1000 lagren? Hur kan vi finna någon lämplig stokastisk modell? Hur stor andel av de 1000 lagren kan vi vänta oss har en livslängd överstigande 106 cykler? ©
Studentlitteratur
1.
Slumpmässig variation
5
Tabell 1.7 Livslängd (i 106 cykler) hos 5 lager.
2.9
0.8
8.2
1.0
4.7
Exempel 1.7 Två olika typer, A och B, av kugghjul skall jämföras. Man valde slumpmässigt ut 10 av typ A och 10 av typ B och undersökte livslängden hos dessa. Tabell 1.8 Livslängd (i tim) hos 10 kugghjul.
Typ A 130 470 210 250 270 510 280 860 160 1130 Typ B 120 340 410 170 400 440 580 520 490 530 Livslängden varierar mycket för båda typerna. Kan man beskriva variationen på något enkelt sätt? Är den ena typen genomsnittligt bättre? Kan man säga någon om det med en rimlig grad av säkerhet? Vad skall man i så fall använda för mått? Exempel 1.8 Vid tillverkning av sjukhusutrustning används en viss typ av elektroniska komponenter. Livslängden hos dessa får inte vara för kort ty då blir de oanvändbara. Eftersom komponenterna förstörs efter ett livslängdsprov kan man bara undersöka ett fåtal slumpmässigt utvalda. Vid ett tillfälle fick man resultatet i tabell 1.9, sid 5. Tabell 1.9 Livslängden (i tim) hos 80 komponenter.
95.3 83.1 87.1 78.9 66.1 84.7 91.5 64.8 61.9 75.0 94.5 78.0 59.3 77.3 87.2 82.2
97.1 83.8 94.3 78.2 76.3 72.7 81.0 93.0
83.4 58.8 81.6 84.7 109.9 73.1 73.5 60.5
66.0 93.6 73.5 103.0 74.9 96.0 97.1 77.8
61.7 100.6 96.3 68.2 72.5 75.5 91.1 67.5
67.9 78.6 87.7 97.3 68.6 87.0 86.0 79.9
69.1 80.2 66.9 85.6 99.6 74.3 86.0 66.5 84.8 82.0 63.4 67.1 110.7 80.9 95.5 109.0
68.3 77.8 79.2 90.1 64.9 80.4 97.9 77.3
Vilken livslängd kan man räkna med att 90% av komponenterna har? Hur mycket kan livslängden tänkas variera? Hur länge kommer komponenterna att räcka i genomsnitt? Exempel 1.9 Ta:r:iproblemet. Författaren besökte våren 1977 universitetet i Sheffield, England. Samtidigt befann sig också den kände amerikanske statistikprofessorn Gottfried Noether där. När vi vid ett tillfälle gjorde en promenad genom staden Sheffield stannade plötsligt Gottfried och ut©
Studentlitteratur
6
1.2.
Några exempel på slumpmässig variation
ropade: "Titta dom har ju nummer på taket också!" (Fast på engelska). Snabbt tog han upp papper och penna och skrev ner taxins nummer. Vi stod kvar ett tag och såg följande taxinummer passera: 97, 234, 166, 7, 65, 17, 4. Sedan frågade Gottfried: "Hur många taxibilar finns det i staden?" Hur skall man med taxinumren kunna uppskatta antalet taxibilar i Sheffield? Exempel 1.10 Hur man får svaret utan att vara säker på att ha ställt frågan. Vid ett amerikanskt universitet ville man undersöka hur stor proportion studenter som regelbundet rökte hasch. Eftersom det är en känslig fråga så kan man inte räkna med att få ärliga svar om inte den som svarar är säker på att få vara anonym. Man löste problemet på följande sätt. Varje student som skulle utfrågas fick en ask som innehöll röda och gröna kulor. När man skakade asken visade sig en kula slumpmässigt i ett fönster på asken. Man lät studenterna övertyga sig om att man inte kunde förutsäga färgen på den kula som kom fram. Den som blev utfrågad fick gå bakom en skärm och fick ett formulär med följande text. Skaka asken. Notera färgen på kulan. Svara Ja eller Nej på endast en av följande två frågor beroende på kulans färg. Om kulan är röd svara på frågan: "Ar sista siffran på ditt studentlegitimationskort udda?" Om kulan är grön svara på frågan: "Röker du hasch minst en gång i veckan?" Sedan alla hade utfrågats hade man ett antal ja-svar och ett antal nej-svar. Vid ett tillfälle då asken innehöll en röd och en grön kula fick man 44% ja-svar. Hur stor proportion studenter röker hasch minst en gång i veckan? Vad händer om man ändrar proportionen röda och gröna kulor i asken? Kan man tänka sig andra frågor än "Ar sista siffran i din legitimation udda"? Exempel 1.11 I december 1977 annonserade Findus på följande sätt: Findus lagar fortfarande Sveriges populäraste köttbullar (näst efter hemlagade förstås). Detta uttalande baserade Findus på en jämförande undersökning utförd av Skandinaviska Marknadsinstitutet i november 1977. Där fick 200 konsumenter jämföra Findus köttbullar med Felix köttbullar. Man fann att 120 av de 200 deltagande konsumenterna tyckte att Findus köttbullar smakade bäst. Kan Findus försvara sitt påstående? Vad bör man ifrågasätta när man läser en sådan annons? ©
Studentlitteratur
1.
7
Slumpmässig variation
. Vi har nu sett några exempel på slumpmässig variation och några frågeställnmgar som kan uppkomma. För att kunna besvara den typen av frågor måste vi skaffa oss kunskap om hur slumpmässig variation kan beskrivas, hur slumpmässiga modeller kan byggas och vilka metoder man har till sin hjälp att dra slutsatser om slumpmässiga företeelser.
,.-------------DET
GÄLLER ATI' LÄRA SIG RÄI------1@l---
b)
c)
2.40 För att kontrollera en tillverkningsprocess stoppar man bandet och väljer på måfå 15 enheter som man undersöker. Om fler än 2 av dessa är defekta så justeras processen. Beräkna sannolikheten att processen justeras om felsannolikheten för processen är 0.05. 2.41
I en fabrik finns 10 maskiner, som arbetar oberoende av varandra. Sannolikheten för driftstopp under en dag är för var och en av maskinerna 0.10. (Se exempel 2.20, sid 67.) Bestäm sannolikheten att a) exakt två,
b) exakt tre,
c) minst en,
d) högst tre,
av maskinerna stoppar under en viss dag. 2.42 Vid ett monteringsband på en verkstad finns 10 arbetare. De använder alla under 20% av arbetstiden en handborrmaskin. Händelserna att olika arbetare i ett visst ögonblick använder sin handborrmaskin antas vara oberoende. Vad är sannolikheten att minst tre av arbetarna i ett visst ögonblick använder sin handborrmaskin? 2.43 Man har ett tillförlitlighetssystem som består av n likadana komponenter. Dessa går sönder oberoende av varandra och varJe komponent har sannolikheten p att fungera under viss tid. Systemet fungerar om minst m av den komponenterna fungerar. Bestäm sannolikheten för att systemet fungerar. © Studentlitteratur
71
2. Några grundläggande begrepp
2.44
Byggelement av en viss sort kan vara behäftade med fel av tre typer, typ I med sannolikheten 0.05, typ Il med sannolikheten 0.10 och typ 111 med sannolikheten 0.03. Ett byggelement kan vara behäftat med fel av flera typer (1, Il eller 111) samtidigt. De olika feltyperna antas förekomma oberoende av varandra. Ett byggelement måste kasseras om minst ett fel av ovanstående typer förekommer. a) Bestäm sannolikheten för att ett element måste kasseras. b) En byggmästare köper 20 av ovanstående byggelement. Vad är sannolikheten att han måste kassera minst 2 stycken?
2.45
I figuren nedan är A, B och C reläer som är slutna med sannolikheterna 0.6, 0.4 respektive 0.3. Händelserna att respektive reläer är slutna är oberoende.
Ll~B r---..,..,r--
Beräkna sannolikheten att a) ingen av lamporna L1 och L2 lyser. b) exakt en av lamporna L1 och L2 lyser.
©
Studentlitteratur
3. Diskreta fördelningar
3.1
Diskreta stokastiska variabler
Vid många slumpmässiga försök är utfallen reella tal tex antalet pulser per tidsenhet (exempel 1.2, sid 2) eller den motverkande kraften i en stödpunkt (exempel 2.7, 46). Men vi har också stött på situationer där utfallen inte är av sådan typ, exempelvis om kedjan skall brista eller hålla (exempel 2.15, sid 62) eller om godset är transportskadat eller ej (exempel 2.13, sid 57). Men i sådana fall kan utfallen ändå förknippas med reella tal genom att de helt enkelt ges ett numeriskt värde. Vi kan låta O stå för att kedjan brister och 1 för att den håller. Varje möjligt utfall i ett slumpmässigt försök kan alltså alltid identifieras med ett reellt tal. Om man betraktar ett sådant försök innan det är utfört, dvs då det fortfarande kan påverkas av slumpen, så kallar man det "slumpberoende resultatet" i form av ett reellt tal för en stokastisk variabel eller slumpvariabel. Vi betecknar stokastiska variabler med grekiska bokstäver~' r,, (, .... Sedan man utfört försöket har man fått ett observerat värde på den stokastiska variabeln. Det observerade värdet betecknas med motsvarande latinska bokstav x, y, z, ... .Vi sammanfattar. Definition Utfallet i ett slumpmässigt försök i form av ett reellt tal, betraktat innan försöket är utfört, kallas för stokastisk variabel. Resultatet sedan man utfört försöket kallas observerat värde på den stokastiska variabeln. Exempel 3.1 Betrakta försöket med radioaktivt sönderfall i exempel 1.2, sid 2, innan mätningarna har påbörjats. Sätt ~
= antal pulser per 5 sekunder.
Då är ~ en stokastisk variabel. Sedan påbörjas mätningarna. Första mätningen ger 3 sönderfall. Då är 3 ett observerat värde på ~, dvs x = 3. Andra mätningen ger x = l, osv. Vi kan aldrig på förhand ange ett värde som ~ helt säkert kommer att anta i en enskild mätning. Däremot kan vi säga att ~ kommer att anta något av värdena 0, 1, 2,3, .... 73
74
3.1.
Diskreta stokastiska variabler
Definition Om en stokastisk variabel bara kan anta ändligt eller numrerbart många värden så säger man att den är diskret.
Den stokastiska variabeln i exempel 3.1 är diskret. Man inser också att varje gång en stokastisk variabel räknar antalet av någonting så är den en diskret stokastisk variabel. Exempel 3.2 Betrakta försöket i exempel 2.4, sid 44. Där väljs 5 motstånd på måfå från en ask med 20 motstånd av vilka 4 är felmärkta. Om vi sätter
~=antalet felmärkta motstånd i urvalet så är ~ en diskret stokastisk variabel som kan anta värdena 0, 1, 2, 3 och 4. Med vilken sannolikhet antas de olika värdena? Lösning: Låt P(~ = x) beteckna sannolikheten att ~ antar värdet x. I exempel 2.4 och exempel 2.10 har vi beräknat P(A 2 ) som ju är detsamma som P(~ = 2), P(A1) = P(~ = 1) och P(Ao) = P(~ = 0). Vi får P(~
= 0)
P(~
= 1)
P(~ = 2)
(~) (156) _ 7 · 13 _ (250) - 19 · 17 (f) (11)
(250)
=
0.2817,
35 . 13 = 19 · 17. 3 = 0.4696,
@(136) (250)
14 · 5 = 19 . 17 = 0.2167.
Med samma resonemang som i exempel 2.10, sid 51, får vi P(~
= 3)
m (~ (250)
P(~
= 4)
(!) Ct)
6)
2. 15
= 19. 17. 3 = 0.0310
(250) =
1
19 · 17. 3
= 0.0010
Eftersom P(~ antar något av värdena 0, 1, 2, 3 eller 4) är 1 så måste I::!=o P(~ = x) vara lika med 1. Kontroll av summan ger mycket riktigt I::!=o P(~ = x) = 1. För att beskriva en stokastisk variabels egenskaper skall man ange vilka värden den kan anta och med vilken sannolikhet dessa värden antas. Man har ©
Studentlitteratur
3. Diskreta fördelningar
75
då angett den stokastiska variabelns sannolikhetsfördelning. Sannolikhetsfördelningen till ~ i exempel 3.2 kan kortfattat skrivas
P(C
..
=
x) = (!) (/~x)
(250)
X
= 0, 1, 2, 3, 4.
Funktionen p(x) = P(~ = x) kallas sannolikhetsfunktionen till f Ibland kallas den även frekvensfunktion. Sannolikhetsfördelningen kan tolkas som en massfördelning på reella axeln, där P(~ = x) är massan i punkten x. Att den totala sannolikhetsmassan är 1 svarar då mot att Lx P(~ = x) = l. Grafiskt kan man beskriva sannolikhetsfördelningen som i figur 3.1. P(j=X) O.lf
o., 0.2. 0.\
Figur 3.1 Sannolikhetsfunktionen i exempel 3.2.
Sannolikhetsfunktionen till en stokastisk variabel ~ kan ses som en förutsägelse om de relativa frekvenser man kan vänta sig om man gör ett stort antal observationer på ~- Om vi i ett slumpmässigt försök inför en stokastisk variabel och bestämmer dess fördelning så har vi bestämt en stokastisk modell eller slumpmodell till försöket. Exempel 3.3 Bestäm en stokastisk modell till försöket i exempel 2.19, sid 66. Lösning: Man tillverkar 6 enheter där sannolikheten att en tillverkad enhet är felaktig är 0.1 och tillverkade enheter blir felaktiga oberoende av varandra. Man är intresserad av antalet felaktiga enheter. Sätt ~ = antal felaktiga enheter bland 6 tillverkade. Då är ~ en diskret stokastisk variabel som kan anta värdena 0, 1, 2, 3, 4, 5 eller 6. Från exempel 2.19 får vi P(~
= o) =
G)o.1°0.9 6 = o.531,
P(~
= 1) =
G)o.1 1 0.95 = o.354,
P(~
= 2)
(~)o.1 2 0.9 4
= 0.098. ©
Studentlitteratur
3.1.
76
Diskreta stokastiska variabler
Allmänt kan vi skriva upp sannolikhetsfördelningen med hjälp av sats 2 D som P(( = x) = (!)o.1xo.9 6 -x,
x = 0, 1,2,3,4,5,6.
Som sig bör blir
tP((
= x) =
x=O
t ______ _____ (!)o.lx0.96 -x = (0.1
+ 0.9) 6 =
"-"
x=O
..,
1
Binomialsatsen
P(I• o.s
O.t ...____._-+-+---.11~---,--- X
O
12
3Lf
S
Figur 3.2 Sannolikhetsfunktionen i exempel 3.2.
Exempel 3.4 I ett försök vill man studera sönderfallet hos ett radioaktivt preparat av exakt samma typ som i exempel 1.2, sid 2. Man tänker mäta antalet pulser per 5 sekunder. Försök finna en lämplig stokastisk modell för försöket.
Lösning: Eftersom man skall mäta antalet pulser per 5 sekunder så gör vi som i exempel 3.1, sid 73, och sätter ( = antal pulser per 5 sekunder. Då är ( en diskret stokastisk variabel som kan anta värdena 0, 1, 2, .... Det återstår att finna en lämplig sannolikhetsfördelning till f Ett tänkbart alternativ är att, på samma sätt som i exempel 2.6, sid 45, utgå från frekvenstabellen tabell 2.1 och låta relativa frekvensen för 0 approximera P (( = 0) o s v. Vi skulle då få fördelningen i den mittersta kolumnen i tabell 3.1, sid 77. Finns det inget teoretiskt resonemang som leder fram till en fördelning som man kan skriva upp i en formel som i exempel 3.2 och exempel 3.3? Söker man i litteratur om radioaktiv strålning så finner man att följande samband kan härledas utgående från naturliga antaganden om radioaktivitetens natur e->-,>.x
P((=x) = --,-,
x.
©
Studentlitteratur
x=0,1,2, ...
3. Diskreta fördelningar
77
där >. är någon lämpligt vald konstant. Om man prövar med några olika värden på >., så får man tex för >. = 4 resultatet i kolumnen längst till höger i tabell 3.1. Här blir 0 P(~ = x) = 0.999 och inte 1 på grund av avrundningsfel. Vi ser i tabell 3.1 att de två kolumnerna stämmer bra överens och antar då att >. = 4. En lämplig sannolikhetsfördelning för ~ är alltså
I:;;:
Tabell 3.1 En tänkbar sannolikhetsfördelning före. P(e
x 0 1 2 3 4 5 6 7 8 9 10 11 12
Från tabell 2.1 0.019 0.073 0.146 0.196 0.195 0.156 0.105 0.059 0.030 0.013 0.005 0.002 0.001
= x).
0.018 0.073 0.147 0.195 0.195 0.156 0.104 0.060 0.030 0.013 0.005 0.002 0.001
P(!=x) O.t
0.1
L-_.__..____.._.._____.,_......,.____...._-+-___,.-------x O
1
2,
3
'+
S
'
?
I
9
10
U
12.
Figur 3.3 Sannolikhetsfunktionen i exempel 3.4.
Hittills har vi beskrivit en stokastisk variabels sannolikhetsfördelning med hjälp av P(~ = x). Man kan också beskriva sannolikhetsfördelningen genom att ange P(~ ~ x) för alla x. Om~ är en diskret stokastisk variabel som bara ©
Studentlitteratur
3.1. Diskreta stokastiska variabler
78
kan anta icke-negativa heltalsvärden gäller
= P({ = O) + P({ = 1) + ... + P({ = x). Om vi känner P({ = x) för varje x så känner vi också P({ $ x) och omvänt. Därför kan vilken som helst av funktionerna P({ = x) och P({ $ x) användas för att beskriva fördelningen för {. Funktionen F(x) = P({ $ x) P({ $ x)
kallas för Jördelningsfunktionen för {. Vi sammanfattar de införda begreppen i en definition. Definition Låt { vara en diskret stokastisk variabel, som antar värdena x1 < x2 < x 3 < ... < Xk < Xk+i < .... Med sannolikhetsfunktionen p till { menas
Med fördelningsfunktionen F till { menas k
F(xk) = P({ $ Xk) =
L P({ = Xi)i=l
Vilken som helst av dessa funktioner kan användas för att beskriva sannolikhetsfördelningen till f Exempel 3.5 Bestäm fördelningsfunktionen till den stokastiska variabeln i exempel 3.2, sid 74. Där är { = antalet felmärkta motstånd i urvalet, då 5 motstånd väljs på måfå från en ask med 20 motstånd, av vilka 4 är felmärkta. Det betyder att { är en diskret stokastisk variabel som kan anta värdena 0, 1, 2, 3, 4. Lösning: I exempel 3.2, sid 74, finns sannolikhetsfunktionen beräknad för vart och ett av de värden som { kan anta. Med hjälp av dessa beräknade värdena och utgående från definitionen ovan får vi
F(0) F(l) F(2)
F(3) F(4)
© Studentlitteratur
= P({ $ 0) = P({ = 0) = 0.2817, P({ $ 1) = P({ = 0) + P({ = 1) = 0.2817 + 0.4696 = 0. 7513, P({ $ 2) = P({ $ 1) + P({ = 2) 0.7513 + 0.2167 = 0.9680, = P({ $ 3) = P({ $ 2) + P({ = 3) 0.9680 + 0.0310 = 0.9990, = P({ $ 4) = P({ $ 3) + P({ = 4) = 0.9990 + 0.0010 = 1.0000.
= = = =
3. Diskreta fördelningar
79
e
Då är en diskret stokastisk variabel är F(x) en trappfunktion, som växer från O till 1, har språng i de x-värden där P(e = x) > 0 och är konstant emellan språngpunkterna. Fördelningsfunktionen F är alltså
F(x)
=
0 0.2817 0.7513 0.9680 0.9990 1
för för för för för för
x. (se appendix). Ur Poissonfördelningstabellen kan vi utläsa hur fördelningen påverkas av parametern >.. Se även figur 3.6. Poissonfördelningen kan också användas för att beskriva antalet gånger som en händelse har inträffat i ett försök, om försöket består av ett stort antal oberoende upprepningar av ett delförsök och händelsen har liten sannolikhet att inträffa vid delförsöket. Det betyder att Poissonfördelningen fungerar bra som approximation till binomialfördelningen om n är stort och p är litet. Exempel 3.9 Man tillverkar 1000 detaljer och har felsannolikheten 0.002. Antag att tillverkningen av de olika detaljerna är oberoende delförsök. Vad är sannolikheten att man får 0, 1, 2, 3, 4 eller 5 felaktiga detaljer? Lösning: Låt ~ vara antalet felaktiga detaljer bland de 1000 tillverkade. Då gäller att~ E Bin(l000,0.002), dvs
p (~=X ) = ( 1000) X 0.002 X · 0.998 1000-x , X= 0, 1, ... , 1000. Om vi räknar ut denna sannolikhet för x = 0, 1, 2, 3, 4, 5 fås värdena i tabell 3.2. Om vi sätter >. = np = 1000 • 0.002 = 2 och räknar ut sannolikheterna. P('TJ = x), där 'f/ är Poissonfördelad med>.= 2 får vi resultatet i tabell 3.2. Vi ser att det är mycket liten skillnad mellan Bin(lO00, 0.002) och P o( 2)-fördelningen. Tabell 3.2 { E Bin(lO00, 0.002) och T/ E Po(2). X
0
1
2
3
4
P(~ = x) P('TJ = x)
0.1351 0.1353
0.2707 0.2707
0.2709 0.2707
0.1806 0.1804
0.0902 0.0902
5 0.0360 0.0361
Allmänt gäller om n är tillräckligt stort och p är tillräckligt litet (tumregeln n > 10, p < 0.1) så kan man göra följande approximation med>.= np: ( n)px(l - Pt-x X
~ c>->.x. x!
Tumregel för approximationen: n > 10, p < 0.1. ©
Studentlitteratur
3. Diskreta fördelningar
87
Vi får strax en minnesregel (sid 95) på hur parametrarna i Poisson- och binomialfördelningen hänger ihop. Vi kan sammanfatta approximationerna mellan hypergeometriska-, binomial och Poissonfördelningen i en figur. Se figur 3.7.
Hyp(N,n,p)
Bin(n,-p)
Po(A)
n>iO p 2) men det blir ganska arbetsamma räkningar. Istället kan vi approximera med en binomialfördelning med n = 200 och p = 0.01, ty n/N = 0.02 < 0.1. Vi får
P(~ > 2) = 1 - P(~
~ 2) =
2
1-
~
(2~
0) 0.01 x · 0.99 200-x = 0.3233.
Eftersom n > 10 och p < 0.1 så skulle man kunna göra ytterligare en approximation till en Poissonfördelning med >. = 200 · 0.01 = 2. Då får man P(~ > 2) = 1 - P(~ ~ 2) = 1 -
2
-22x 1- = X.
L _ex=O
0.3233.
Den sistnämnda sannolikheten är något enklare att räkna ut än den tidigare. ©
Studentlitteratur
3.2.
88
Några ofta förekommande diskreta fördelningar
Om vi har mindre än 1% defekta i förpackningen så bör vi alltså vänta oss högst 32.33% förpackningar med mer än 2 defekta i urvalet. Ur tabell 1.1, sid 2, kan vi läsa att det blev 28 förpackningar med fler än 2 defekta. Skall vi slå larm? Hur pass säker är vår metod? Finns det andra bättre metoder?
Övningar 3.8
Antalet inkommande samtal { per 10 minutersperiod är Po(2). Bestäm sannolikheten att det under en 10-minutersperiod kommer a) högst 3 samtal, c) minst 2 samtal.
b) precis 3 samtal,
3.9
Ett slumpmässigt försök lyckas med sannolikheten 0.3. Man gör 10 oberoende upprepningar av försöket. Låt { vara antalet lyckade försök bland de 10. Bestäm först sannolikhetsfördelningen till f Bestäm sedan sannolikheten att b) precis 3 försök lyckas, a) högst 3 försök lyckas, d) högst 4 försök misslyckas. c) minst 2 försök lyckas,
3.10
Samma uppgift som 3.9 men då ett försök lyckas med sannolikheten 0.8.
3.11
I övning 2.1, sid 52, gäller att bland 10 muttrar finns 4 defekta. Man väljer på måfå 4 muttrar bland de 10 muttrarna. Låt { vara antalet defekta muttrar i urvalet. Bestäm sannolikhetsfördelningen till f
3.12
I exempel 2.17, sid 64, gäller att med sannolikhet 0.6 är livslängden hos en viss typ av glödlampor mer än 1000 timmar. Man kopplar 5 sådana lampor i ett belysningsnät. Händelsen att olika lampor slocknar kan antas oberoende. Låt { vara antalet lampor som lyser mer än 1000 timmar. a) Bestäm sannolikhetsfördelningen till {. b) Vad är sannolikheten att minst 3 lampor lyser mer än 1000 timmar?
3.13
©
Antalet inkommande samtal under 1 minut till en telefonväxel antas vara Poissonfördelat med parametern 5. Bestäm sannolikheten att man under en viss 1-minutersperiod skall få in mer än två samtal.
Studentlitteratur
3.
Diskreta fördelningar
89
3.14 I en fabrik finns 10 maskiner som arbetar oberoende av varandra. Sannolikheten för driftstopp under en dag är för var och en av maskinerna 0.10. Man är intresserad av antalet maskiner som stoppar en viss dag. Bestäm en lämplig stokastisk modell. (Jämför exempel 2.20, sid 67.) 3.15
Antag att antalet stoftpartiklar per volymsenhet i en viss gruva är Poissonfördelat och att medelantalet partiklar per liter är ,\. Om ,\ = 6 vad är sannolikheten att i en liter få a) mindre än 2 partiklar?
3.16
b) mer än 6 partiklar?
7 kullager av svensk tillverkning och 11 kullager av tysk tillverkning används på exakt samma sätt. Efter 4 år är alla utom 5 nedslitna. Kullagren kan antas vara exakt lika bra. Bestäm sannolikhetsfördelningen för antalet svenska lager som fortfarande håller.
3.17 Vid ett monteringsband på en verkstad finns 10 arbetare. De använder alla under 20% av arbetstiden en handborrmaskin. Händelserna att olika arbetare i ett visst ögonblick använder sin handborrmaskin antas vara oberoende. Låt ~ vara antalet arbetare som i ett visst ögonblick använder sin handborrmaskin. Bestäm sannolikhetsfördelningen till f (Jämför övning 2.42, sid 70.) 3.18 I övning 2.2, sid 52, tas 5 glödlampor på måfå ur en låda med 15 glödlampor av vilka 5 är defekta. Man är intresserad av antalet defekta glödlampor i urvalet. Bestäm en lämplig stokastisk modell. 3.19
Antalet tankfartyg som ankommer till en bestämd hamn under loppet av en dag har visat sig vara Poissonfördelat med,\= 2. Hamnen kan maximalt betjäna 3 tankfartyg per dag. De tre först ankomna blir betjänade, eventuellt övriga blir omdirigerade till en annan hamn. a) Bestäm sannolikheten för att det en bestämd dag kommer att omdirigeras fartyg till en annan hamn. b) Hur stor kapacitet bör hamnen byggas ut till för att med minst 95% sannolikhet kunna betjäna samtliga fartyg som ankommer en bestämd dag?
3.20 Felkvoten vid en tillverkningsprocess är 0.05. Ur ett parti om 3000 tillverkade enheter väljer man på måfå 100 enheter och justerar processen ©
Studentlitteratur
3.2. Några ofta förekommande diskreta fördelningar
90
om fler än k av dessa är defekta. Bestäm det minsta k, för vilket det gäller att P(processen justeras) < 0.05. 3.21
Ur ett parti med taktegel packat i buntar tar man slumpmässigt 15 buntar för kontroll. Hur stor är sannolikheten att man i dessa buntar hittar någon spräckt tegelpanna om partiet består av 1000 buntar varav 150 innehåller några spräckta tegelpannor?
3.22
Antalet bilar som passerar rondellen vid Haparanda-Bodenvägen kan under tiden 13.30-15.30 antas vara Poissonfördelat med parameter 4 (tidsenhet = 1 minut). Bestäm sannolikheten för att det under någon av 120 olika 1-minutersperioder passerar mer än 11 bilar.
3.23 Från ett parti bestående av 5000 TV-apparater tar man helt slumpmässigt ur 100 för kontroll (utan återläggning). Hur stor är sannolikheten att urvalet innehåller högst 2 defekta om det i hela partiet finns 15 defekta? 3.24 En kabel består av 100 ståltrådar. Sannolikheten att en 1 km lång ståltråd är defekt är 0.01. Kabeln måste för att bära angiven tyngd bestå av åtminstone 97 helt felfria trådar. Vad är sannolikheten att en 1 km lång kabel kan bära angiven tyngd? 3.25
En viss produkt levereras i partier om vardera 2000 enheter. Följande provtagningsschema tillämpas: Ur varje parti väljs slumpmässigt utan återläggning 80 enheter som kontrolleras. Om högst en enhet är defekt godkänns partiet, i annat fall underkänns det. Beräkna sannolikheten att man godkänner ett parti vars andel defekta enheter är a) 0.005,
b) 0.05.
3.26 Ett försäkringsbolag har upptäckt att bara 0.1 % av befolkningen är inblandad i en viss sorts olycka varje år. Om 10000 försäkringstagare slumpmässigt väljs ut bland befolkningen, vad är sannolikheten att mer än 10 blir inblandade i en sådan olycka nästa år? 3.27 Gör en jämförelse mellan Poissonfördelningen och binomialfördelning genom att beräkna P(~ = 2), P(~ = 5) och P(~ = 8) dels om ~ E Bin(n,p) och dels om~ E Po(>-.), där)..= np samt ©
Studentlitteratur
3. Diskreta fördelningar
91
a) n = 10, p = 0.05, c) n = 10, p = 0.5, e) n = 18, p = 0.l,
b) n = 10, p = 0.l, d) n = 18, p = 0.05, f) n = 18, p = 0.5.
När är överensstämmelsen god? Varför? (Jämför exempel 3.9, sid 86.)
3.3
Väntevärde
Vi inleder med ett exempel. Exempel 3.11 En maskin klipper metalltråd till önskad längd. På grund av bristande noggrannhet hos klippmekanismen kommer längden hos den tillklippta tråden att variera något. Av erfarenhet vet man att det är 60% chans att längden av metalltråden blir sådan att den kan säljas till fullt pris, vilket ger en vinst på 1.20 kr. Vidare är det 25% chans att den blir för lång för att säljas till fullt pris. Men eftersom den då kan klippas till önskad längd ger den ändå en vinst på 0.50 kr. Det är 15% chans att den blir för kort och måste kasseras. Det medför en förlust på 0.30 kr. Antag att man klipper till ett stort antal metalltrådar. Vad kan man säga om
a) den totala vinsten? b) vinsten per tillklippt metalltråd? Lösning: Antag att man klipper till N trådar och att N1 av dem blir för korta, N 2 blir "lagom" långa och N3 blir för långa, där
a) Den totala vinsten är -0.30N1
+ 1.20N2 + 0.50N3
b) Vinsten per tillklippt tråd blir då -0.30N1 + 1.20N2 N
+ 0.50N3
N1 -0.30 · N
N2
+ 1.20 · N =
N3
+o.5o•Ji· Efter ett stort antal tillklippta trådar bör Ni/ N :=::: 0.15, N2/N :=::: 0.60 och N 3/ N :=::: 0.25. Då blir vinsten per tillklippt tråd approximativt -0.30 · 0.15 + 1.20 · 0.60 + 0.50 · 0.25
= 0.80. ©
Studentlitteratur
3.3.
92
Väntevärde
Det är alltså möjligt att göra en förutsägelse om vinsten per tillklippt tråd, dvs vi kan räkna ut en förväntad vinst per metalltråd. Detta gör vi genom att utnyttja sannolikheterna för de tre olika inblandade händelserna. Vi kan också genomföra resonemanget ovan genom att införa en sannolikhetsfördelning. Betrakta vinsten per tillklippt metalltråd som en stokastisk variabel ~. Då har ~ sannolikhetsfördelningen P(~ = -0.30) = 0.15,
P(~ = 0.50) = 0.25,
P(~ = 1.20) = 0.60.
Den förväntade vinsten per tillklippt tråd är då -0.30 · P(~ = -0.30)
+ 0.50 · P(~ =
0.50)
+ 1.20 · P(~ =
1.20).
Detta värde kallas för väntevärde för den stokastiska variabeln ~ och betecknas E(~). (Väntevärde heter på engelska" expectation".) Resonemanget i exempel 3.11 för att beräkna ett väntevärde kan tillämpas på varje diskret stokastisk variabel f Det leder till följande definition.
Definition Låt ~ vara en diskret stokastisk variabel som kan anta värdena X3, .... Då är väntevärdet för~
X1,
x2,
Ibland kommer vi att använda beteckningenµ för väntevärdet E(O. Istället för väntevärde säger man ibland förväntat värde. Väntevärdet för en stokastisk variabel ~ kan ses som en förutsägelse om det medelvärde man kan vänta sig om man gör ett stort antal observationer på ~ och beräknar medelvärdet. Man kan tolka sannolikhetsfördelningen för en stokastisk variabel ~ som en massfördelning på reella axeln, med massan P(~ = xi) i punkten xi. Väntevärdet är då fördelningens masscentrum. Se figur 3.8.
Q.I
_ _,__-+------1-----~--x -0.30 o.so 1 1.20 Figur 3.8 Fördelningen i exempel 3.11.
©
Studentlitteratur
3. Diskreta fördelningar
93
Vi ser att E(e) är ett lägesmått som anger var massfördelningen eller sannolikhetsfördelningen ligger "i genomsnitt". Väntevärdet E(e) är ett lägesmått för sannolikhetsfördelningen på samma sätt som x är ett lägesmått för ett statistiskt material.
Exempel 3.12 Beräkna väntevärdet för den stokastiska variabeln i exempel 3.2, sid 74.
e
Lösning: I exempel 3.2 är antalet felmärkta motstånd i urvalet då man väljer 5 motstånd utan återläggning ur en ask med 20 av vilka 4 är felmärkta. Från exempel 3.2 får vi sannolikhetsfördelningen till
e
c ) P( -.=X=
dvs
eE Hyp(20,5,4/20). x P(e
O
(!) (/~:c)
0 123 4 (250) 'X=,,,,.
Om vi beräknar sannolikheterna får vi
l
2
3
4
= x) 0.2817 0.4696 0.2167 0.0310 0.0010
Väntevärdet för
eblir då
E(e) = 0 · 0.2817 + 1 · 0.4696 + 2 · 0.2167 + 3 · 0.0310 + 4 · 0.0010 = 1
P('C=X)
0.1
.....,_..___,.___.....,.._......_. X o 1 2 3 lf Figur 3.9 Fördelningen i exempel 3.12 med inprickat E(e).
Det är ingen tillfällighet att E(e) = 1 och np = 5 · 4/20 = 1 i exempel 3.12. Man kan nämligen visa allmänt att om
e E Hyp(N,n,p) så är E(e) = np. Om vi väljer ut n kulor ur en urna som innehåller proportionen p svarta så kan vi vänta oss att få "i genomsnitt" np svarta kulor. Det stämmer även med vår intuition. © Studentlitteratur
94
3.3.
Exempel 3.13 Beräkna väntevärdet för den stokastiska variabeln
~
Väntevärde
i exempel 3.3, sid
75. Lösning: Den stokastiska variabeln ~ är antalet felaktiga enheter bland 6 tillverkade, när sannolikheten är 0.1 att en tillverkad enhet blir felaktig och tillverkade enheter blir felaktiga oeroende av varandra. Från exempel 3.3 får vi att
dvs~ E Bin(6, 0.1). Om vi beräknar sannolikheterna gäller
0 l 2 3 4 5 6 P(~ = x) 0.5314 0.3543 0.0984 0.0146 0.0012 0.0001 0.0000 x
Väntevärdet för
~
blir alltså
E(O = 0 · 0.5314 + 1 · 0.3543 + ... + 6 · 0.0000 = 0.6. Se figur 3.10, sid 94. Inte heller här är det någon tillfällighet att vi får E(O 6 · 0.1 = 0.6 i exempel 3.13. Man kan visa att om ~ E Bin(n,p)
= 0.6 och
np
=
så är E(O = np.
Detta stämmer ju också med vår intuition. Om sannolikheten är p att händelsen A inträffar i ett delförsök och vi upprepar det delförsöket n gånger så väntar vi oss att "i genomsnitt" skall A inträffa np gånger.
Figur 3.10 Fördelningen i exempel 3.13 med inprickat E({).
©
Studentlitteratur
3. Diskreta fördelningar
95
Man kan även visa att om { E
= .X.
Po(>.) så är E({)
Om vi tänker oss·att Poissonfördelningen uppkommer genom att vi betraktar händelser A som inträffar slumpmässigt och oberoende av varandra i tiden så anger just parametern .X genomsnittliga antalet händelser per tidsintervall (se sid 85). Exempel 3.14 Beräkna väntevärdet för den stokastiska variabeln { i exempel 3.4, sid 76. Lösning: I exempel 3.4 betyder { antalet pulser per 5 sekunder vid sönderfall hos ett radioaktivt preparat. Vi fann att { har sannolikhetsfördelningen
dvs { E Po(4). Alltså är E({)
= 4.
Se figur 3.11.
0.2
0.1
O
l
2.
'5
oCt
S
"
1
t
9
\0
\2.
U
Figur 3.11 Fördelningen i exempel 3.13 med inprickat E(e).
Väntevärdena i hypergeometriska-, binomial- och Poissonfördelningen ger oss en minnesregel för approximationerna mellan dessa fördelningar. Se figur 3.7, sid 87. Parametrarna väljs så att väntevärdena i ursprungsfördelningen och den approximerande fördelningen blir lika. Det innebär att när vi approximerar från hypergeometriska fördelningen till binomialfördelningen står n och p för samma sak. När vi approximerar från binomialfördelningen till Poissonfördelningen så skall np från binomialfördelningen sättas lika med parametern .X i Poissonfördelningen. ©
Studentlitteratur
3.3.
96
Väntevärde
Övningar 3.28
Bestäm, med hjälp av definitionen (3.3), väntevärdet för~' om~ är a) likformigt fördelad på 1, 2, ... , 6, exempelvis antalet ögon vid kast med en symmetrisk tärning. b) likformigt fördelad på 1, 2, ... , N.
3.29 I övning 3.1, sid 80, bestämdes sannolikhetsfördelningen till antalet maskiner ~ som kommer att fungera efter 6 månader. Den blev x
P(~
= x)
I
O 0.125
1 0.375
2 0.375
3
0.125
Beräkna väntevärdet för ~. 3.30
Antalet tankfartyg som ankommer till en viss hamn under loppet av en dag har visat sig vara Poissonfördelat med parameter >. = 2. a) Bestäm väntevärdet för antalet ankommande tankfartyg under en bestämd dag. b) Bestäm det sannolikaste antalet ankommande fartyg under en bestämd dag. (Det sannolikaste värdet är det som har störst sannolikhet.)
3.31
Vid ett monteringsband på en verkstad finns 13 arbetare. De använder alla under 20% av arbetstiden en handborrmaskin. Händelserna att olika arbetare i ett visst ögonblick använder sin handborrmaskin antas vara oberoende. a) Bestäm sannolikhetsfördelningen till antalet arbetare som i ett visst ögonblick använder sin handborrmaskin. b) Vad är väntevärdet för antalet arbetare som i ett visst ögonblick använder sin handborrmaskin? c) Vilket är det sannolikaste antalet arbetare som i ett visst ögonblick använder sin handborrmaskin?
3.32
©
Kalixkillen Kalle försöker bättra på sin ekonomiska situation genom att sälja tidningar på söndagarna. Tyvärr är det inte så stor efterfrågan på hans tidningar. Han har funnit att efterfrågan pendlar mellan 2 och 20 tidningar. Han bedömer sannolikheten för olika antal efter-
Studentlitteratur
3. Diskreta fördelningar
97
frågningar på följande sätt. Antalet efterfrågade tidningar Sannolikhet Antalet efterfrågade tidningar Sannolikhet Antalet efterfrågade tidningar Sannolikhet
2
3
4
5
6
7
8
0.1
0.1
0.1
0.1
0.04
0.04
0.04
9
10
11
12
13
14
15
0.04
0.04
0.04
0.04
0.04
0.04
0.04
16
17
18
19
20
0.04
0.04
0.04
0.04
0.04
a) Beräkna väntevärdet av antalet efterfrågade tidningar. b) Kalle betalar 2 kronor i inköp för varje tidning, som han sedan säljer för 2.50 kr. Tidningar som han inte säljer får inte lämnas tillbaka, så på dessa förlorar han 2 kronor. Beräkna sannolikhetsfördelningen och väntevärdet för Kalles vinst om han skaffar sig lika många tidningar som väntevärdet av antalet efterfrågade tidningar. c) Hur många tidningar skall Kalle skaffa sig varje söndagsmorgon för att hans förväntade vinst skall bli så stor som möjligt? Besvara frågan genom att beräkna väntevärdet av Kalles vinst om han varje söndagsmorgon startar med 8, 7, 6, 5, 4 tidningar. 3.33 Pitepilten Pelle säljer julgranar till jul. Han har funnit att det är liten efterfrågan på stora granar (minst 4 m höga). Han bedömer efterfrågan på följande sätt: Antal efterfrågade stora julgranar Sannolikhet
1
2
3
4
5
0.1
0.1
0.3
0.3
0.2
Han köper dessa granar för 30 kr och säljer dem för 90 kr. Vidare kostar det honom 10 kr att bli av med en sådan gran, som han inte lyckas sälja. Hur många granar av denna typ bör han skaffa för att hans förväntade vinst skall bli så stor som möjligt?
3.4
Varians och standardavvikelse
Väntevärdet är ett lägesmått. Det anger hur stora värden den stokastiska variabeln antar "i genomsnitt". Men om vi vet att två stokastiska variabler ©
Studentlitteratur
Varians och standardavvikelse
3.4.
98
har samma väntevärde så kan deras fördelningar ändå skilja sig betydligt åt. Se figur 3.12.
;(E(i)
o.s
0,5
Oi 0
l
2
3
'-I
-3 -2.
-l
0
l
b)
8.)
Figur 3.12 Fördelningar med E(~)
= 2.
För att skilja fördelningarna i figur 3.12 åt så räcker det inte att man anger endast väntevärde. Man måste också ange ett mått på hur utspridd fördelningen är, dvs ett mått på hur mycket den stokastiska variabeln kan variera. Låt ~ vara en stokastisk variabel med E(~) = µ. Ett tänkbart spridningsmått är den "genomsnittliga" avvikelsen frånµ, dvs E(I~ - µI). Men detta mått är besvärligt att handskas med matematiskt och används därför inte. Istället används den "genomsnittliga" kvadratiska avvikelsen från µ, dvs E((~ - µ) 2 ). Detta mått kallas variansen för~ och betecknas V(O. Variansen har inte samma dimension som väntevärdet. Om exempelvis väntevärdet har dimensionen längd så har variansen dimensionen (längd) 2 . För att få ett spridningsmått med samma dimension som väntevärdets så bildar man Jv"[). Detta mått kallas standardavvikelsen för f Vi har då följande definition.
Definition Låt~ vara en diskret stokastisk variabel som antar värdena x 1 , x 2 , x 3 , ... och har väntevärde E(O = µ. Variansen för~' definieras som
Standardavvikelsen för~ definieras som
Jv"[).
Variansen betecknas ofta med a 2 och standardavvikelsen med o-. För att det ska framgå till vilken stokastisk variabel variansen och standardavvikelsen hör så kan man använda beteckningen o-~ respektive a{. ©
Studentlitteratur
99
3. Diskreta fördelningar
Exempel 3.15 Beräkna varians och standardavvikelse för de stokastiska variablerna vars fördelningar är beskrivna i figur 3.12, sid 98. Lösning: Fördelningen i figur 3.12 a) är
\o
x
1
2
3
4
(~ = x) 0.1 0.2 0.4 0.2 0.1 Väntevärdet är E(~)
= 2.
Variansen blir då
5
a2
V(~)
=
I)xi - 2) 2 P(~ = xi) = i=l
(-2) 2 -
0.1
+ (-1) 2 · 0.2 + 02 · 0.4 + 12 · 0.2 + 22 · 0.1 =
1.2. Standardavvikelsen blir alltså
v'l2 ~ 1.1.
a= Fördelningen i figur 3.12 b) är X
P(~ = x)
1-3
-1 0.2
0.1
2 0.4
Eftersom väntevärdet även här är E(~)
a2
V(~)
= I)xi - 2) 2 P(~ =
(-5) 2 - 0.1
5 0.2
7 0.1
= 2 blir variansen
Xi)
=
+ (-3) 2 · 0.2 + 02 · 0.4 + 32 · 0.2 + 52 · 0.1 =
8.6. Standardavvikelsen är då
a=
J8.6 ~ 2.9.
-l
-2
-1
o
d
i
2.3'15"':
d
Figur 3.13 Fördelningarna i figur 3.12 med spridningsmått inprickade.
© Studentlitteratur
100
3.4.
Varians och standardavvikelse
Om man ser sannolikhetsfördelningen som en massfördelning så svarar variansen mot tröghetsmomentet för denna massfördelning. Variansen 0' 2 = V(~) och standardavvikelsen O' för en stokastisk variabel är spridningsmått för sannolikhetsfördelningen till f Termerna varians och standardavvikelse har vi redan stött på i kapitel 1 men då som namn på s 2 och s, dvs som spridningsmått för ett statistiskt material. Men även om samma termer används så är 0' 2 inte detsamma som s 2 och O' är inte detsamma som s. I fall där det finns risk för termsammanblandning så skriver vi 0' 2 som variansen för en stokastisk variabel och s 2 som variansen för ett statistiskt material. Man kan visa att följande gäller: Om~ E Bin(n,p), så är V(~)= np(l - p). Om~ E Po(>.), så är V(~) = >..
.
Om~ E Hyp(N, n,p), så är V(~) = ~=~ np(l - p). Exempel 3.16 Beräkna varians och standardavvikelse för den stokastiska variabeln ~ i exempel 3.3, sid 75. Lösning: Den stokastiska variabeln ~ är antalet felaktiga enheter bland 6 tillverkade, när sannolikheten är 0.1 att en tillverkad enhet blir felaktig och tiUverkade enheter blir felaktiga oberoende av varandra. Eftersom~ E Bin(6, 0.1) så är
V(O = 6 · 0.1 · (1 - 0.1) = 0.54 och
O'
= ✓cfs4 = 0.73.
-~-----4"-...L...~,---+----- X
2tS ".d1.
2
3
"
S"
"
Figur 3.14 Fördelningen i exempel 3.16 med u inprickat.
©
Studentlitteratur
3. Diskreta fördelningar
101
Övningar 3.34 Bestäm, med hjälp av definition (3.4), varians och standardavvikelse för { om { är likformigt fördelad på 1, 2, ... , 6. (exempelvis antalet ögon vid kast med en symmetrisk tärning.) Rita sannolikhetsfördelningen och pricka in µ och c; (µ är beräknat i övning 3.25 a), sid 90.) 3.35 I övning 3.29, sid 96, beräknades väntevärdet för antalet maskiner { som kommer att fungera efter 6 månader när fördelningen för { är x
I
O
1
2
3
({ = x) 0.125 0.375 0.375 0.125 Det blevµ = 1.5. Beräkna varians och standardavvikelse till fördelningen och pricka in µ och c;. 3.36
f
Rita
Antalet tankfartyg som ankommer till en viss hamn under loppet av en dag har visat sig vara Poissonfördelat med>.= 2. Bestäm varians och standardavvikelse för antalet ankommande fartyg under en bestämd dag.
3.37 I en fabrik finns 10 maskiner som arbetar oberoende av varandra. Sannolikheten för driftstopp under en dag är för var och en av maskinerna 0.10. Låt { vara antalet maskiner som stoppar en viss dag. Bestäm a) sannolikhetsfördelningen till {, b) varians och standardavvikelse för {. 3.38 Bland 10 muttrar finns 4 defekta. Man tar 4 muttrar på måfå utan återläggning. Låt { vara antalet defekta muttrar i urvalet. Bestäm a) fördelningen till {, b) varians och standardavvikelse för {. 3.39 Ett bilförsäkringsbolag är, för premieberäkning, intresserat av~= antalet personer per bil. Med ledning av resultatet vid en större trafikundersökning bestämdes sannolikhetsfördelningen till { enligt x
P({
= x)
l 2 0.30 0.25
3 4 5 0.20 0.15 0.05
6 0.03
7 0.01
8 0.01
Beräkna väntevärde och standardavvikelse för antalet personer per bil. ©
Studentlitteratur
102
3.4. Varians och standardavvikelse
3.40
En medicin ger upphov till en viss biverkan med sannolikhet 0.20. Man ger denna medicin till 30 patienter. Biverkans uppträdande hos olika personer är oberoende. Bestäm väntevärde, varians och standardavvikelse för antalet personer som drabbas av biverkan.
3.41
Vid ett konstruktionsarbete kan tiden med vilket arbetet kan försenas betraktas som en diskret stokastisk variabel och beskrivas med följande sannolikhetsfunktion. x i dagar
1
2
3
4
0.5
0.3
0.1
0.1
a) Bestäm väntevärdet och standardavvikelsen för tiden med vilket arbetet kan försenas. b) Om arbetet försenas får konstruktionsfirman "böta", dels en fast kostnad på 10 000 kr och sedan 15 000 kr per försenad dag. Bestäm böternas väntevärde och standardavvikelse genom att först bestämma sannolikhetsfördelningen för böterna. c) Försök bestämma väntevärde och standardavvikelse för böterna utan att bestämma sannolikhetsfördelningen för böterna. Använd resultatet i a).
©
Studentlitteratur
4. Kontinuerliga fördelningar
4.1
Kontinuerliga stokastiska variabler
Hittills har vi sysslat med diskreta stokastiska variabler, dvs sådana som bara kan anta ändligt eller numrerbart många värden. Men i många situationer är man intresserad av storheter som kan anta alla värden i ett intervall. Exempel 4.1 Betrakta åter den 1 m långa lättmetallbalken i exempel 2.7, sid 46. Där skall man placera en last på 10 kg godtyckligt på balken. (Se figur 4.1.) Låt ~ vara den motverkande kraften i stödpunkten S1 (enhet: N). Då är ~ en stokastisk variabel som kan anta alla värden i intervallet [O, 100]. 100N
s,_
~
- - - - - - -..........- - : - 1 .
(g:tO.Om/~) 1m Figur 4.1
Exempel 4.2 Man skall fortsätta med ett försök av exakt samma typ som i exempel 1.5, sid 4, där man studerar tiden det tar att lasta malm. Låt ~ vara tidsåtgången vid lastning med vibration. Då är ~ en stokastisk variabel som antar värden i något tidsintervall, som kan vara svårt att ange på förhand. Men om vi tar till lite extra så kan vi säga att~ kommer att anta värden i intervallet JO, oo[. Vi skall senare se att det inte spelar någon roll om vi väljer ett för stort intervall.
103
104
4.1.
Kontinuerliga stokastiska variabler
I situationer, som i exempel 4.1 och exempel 4.2, där { kan anta alla värden i ett intervall, säger man att { är en kontinuerlig stokastisk variabel. Vi skall nu se hur vi kan beskriva dess sannolikhetsfördelning. Vi fortsätter att betrakta den stokastiska variabeln i exempel 4.2. För att bestämma en tänkbar sannolikhetsfördelning till { kan vi resonera analogt med exempel 3.4, sid 76. Där skulle vi bestämma fördelningen till antalet pulser per 5 sekunder från ett radioaktivt preparat och utgick då ifrån den information som fanns i en frekvenstabell. Här skulle vi kunna utgå från tabell 1.12, sid 15. Vi får då: Tabell 4.1 Tidsåtgången vid lastning med vibration.
Klassgränser (sek) 65- 75 75- 85 85- 95 95 -105 105 - 115 115 - 125 125 -135 135 - 145 145 -155 155 - 165 165 - 175 175 - 185
Relativ frekvens 0.016 0.136 0.104 0.176 0.192 0.136 0.112 0.032 0.056 0.008 0.008 0.024 1.000
Vi åskådliggör tabellen med ett histogram (se figur 4.2), där arean av varje rektangel är lika med relativa frekvensen i motsvarande klass. Totala arean under histogrammet blir då l.
Figur 4.2
©
Studentlitteratur
4.
105
Kontinuerliga fördelningar
Utgående från histogrammet i figur 4.2 (eller tabell 4.1) skulle vi kunna approximera sannolikheten att ~ hamnar i en given klass med arean av rektangeln över klassen, dvs P(65
< ~ :S 75)
~
0.016, P(75
< ~ :S 85)
~
0.136 osv.
Men det ger dåliga approximationer, eftersom histogrammet i figur 4.2 är baserat på endast 125 observationsvärden. För att övervinna det problemet måste man ha fler observationer. Vidare för att få en bra approximation av tex P(76 < ~ :S 79) eller P(84 < ~ :S 86) så behövs en finare klassindelning. Vi kan tänka oss att vi skaffar oss fler och fler observationer i materialet och gör klassindelningen finare och finare (se figur 4.3).
Figur 4.3
f
Till slut kan vi approximera histogrammet med en kontinuerlig funktion (se figur 4.4).
Figur 4.4
Denna funktion f, som är ett tänkt gränsfall av histogrammet, blir då en lämplig funktion för att beskriva sannolikhetsfördelningen till f Sanno©
Studentlitteratur
4.1.
106
Kontinuerliga stokastiska variabler
likheten att~ antar värden mellan a och b blir då arean under kurvan y mellan x = a och x = b (se figur 4.5), dvs
P(a
0.53)
c) P({ :5 -0.53).
Lösning: Vi använder tabellen i appendix och får
a) P({ :5 1) = (l) = {ur tabellen}= 0.8413. b)
P({ > 0.53)
= =
1 - P({ $ 0.53) = 1 - (0.53) = 1 - 0.7019 = 0.2981.
PCl>0.53)
-o.sa
o
X
o.sa
Figur 4.15 N(O, 1)-fördelningen.
c) När vi skall beräkna P({ < -0.53) ser vi att (x) inte är tabellerad för negativa x-värden. Men då utnyttjar vi att frekvensfunktionen för N(0, 1)-fördelningen är symmetrisk kring 0. På grund av symmetrin kring 0 blir (se figur 4.15). P({ $ -0.53) = P({ > 0.53) = 1 - (0.53) = 0.2981
Allmänt gäller på grund av symmetrin (-x) = 1 - (x) ©
Studentlitteratur
4.2. Några ofta förekommande kontinuerliga fördelningar
118
För att bestämma P(~ ~ x) då~ E N(µ, a), för godtyckliga värden påµ och a så utnyttjar vi följande resultat. Sats 4 B Om~ EN(µ, a) så gäller
P(~ ~ x)
=~
(x-µ) -a-
.
Bevis: Det gäller att P(~
~
x) =
1-
x
-oo
1
--e-(t-µ)
2
a/2-i
l( 2 u
2
) dt
Nu gör vi variabelsubstitutionen u = t - µ i integralen och får då (7
P(~
~ x) =
17 /2-rr
_l_e-u2/2 du=
-oo
~(x - µ) (7
Vi kan åskådliggöra resultatet i sats 4 B på följande sätt (se figur 4.16) .
.t.reOl'l\a
h"'ka.
N(O,t)
\ Figur 4.16
Exempel 4.9 En elkabels diameter (enhet: dm) är normalfördelad med parametrar µ = 0.8 och a = 0.02. Vad är sannolikheten att diametern
a) är högst 0.82 dm, c) är mellan 0.77 dm och 0.83 dm? © Studentlitteratur
b) är mer än 0.81 dm,
4. Kontinuerliga fördelningar
Lösning: Låt
119
evara elkabelns diameter.
Då gäller eE N(0.8, 0.02).
a) Vi söker P(e ~ 0.82) och använder sats 4 B och tabellen i appendix för att beräkna den.
b) P(e > 0.81)
c)
P(0.77
= =
< e :5 0.83)
1- P(e
:s 0.81) = 1- cI>( 0·8~-~2°· 8 ) =
1 - cI>(0.5) =
=1-
0.6915
= 0.3085 :::::: 0.31.
P(e :5 0.83) - P(e :5 0.77) = cI>(0.83 - 0.8)- cI>(0.77- 0.8) 0.02 0.02 cI>(l.5) - cI>(-1.5) =
= =
cI>(l.5) - (1- cI>(l.5))
=
= 2cI>(l.5) -1 =
2 · 0.9332 - 1 = 0.8664 :::::: 0.87.
Figur 4.17 Frekvensfunktionen för N(0.8,0.02).
Övningar 4. 7
Till en tunnelbanestation anländer tåg med 10 minuters intervall. En person som inte har någon tidtabell anländer slumpmässigt till stationen. Den tid personen får vänta tills ett tåg anländer kan betraktas som en stokastisk variabel f a) b) c) d)
Vilka värden kan eanta? Bestäm fördelningsfunktionen till eoch rita den. Bestäm frekvensfunktionen och rita den. Vad är sannolikheten att personen får vänta i mer än 7 minuter?
© Studentlitteratur
120
4.2. Några ofta förekommande kontinuerliga fördelningar
4.8
Om vi avrundar ett tal korrekt till k decimaler så kan vi betrakta avrundningsfelet som en stokastisk variabel e. Ange en lämplig sannolikhetsfördelning till e.
4.9
En transistors livslängd (i år) antas vara exponentialfördelad med parameter >. = 1/8. a) Vad är sannolikheten att den håller i minst 10 år? b) Om den efter 4 år är hel vad är (den betingade) sannolikheten att den håller i ytterligare 10 år?
e
4.10 Tiden i minuter att betjäna en kund i ett visst betjäningssystem antas vara exponentialfördelad med parameter >. = 0.1. Beräkna
a) P(e 4.11
> 5),
b) P(e > 10),
c) P(e
< 8).
e
e
För livslängden (i timmar) för en viss typ av elektronrör gäller E Exp(0.001). Man har sex sådana rör, som kan antas fungera oberoende av varandra, i en apparat. Låt 11 vara antalet rör som fungerar efter 2000 timmar. Beräkna a) P(e > 2000),
b) P(11
= 3),
c) P(11
> 3).
4.12 På en gatstump av längden 13 m parkeras slumpmässigt en bil av längden 5. Vad är sannolikheten att ytterligare en bil av samma längd får plats? 4.13 För en viss typ av kullager kan livslängden (i år) betraktas som en Weibullfördelad stokastisk variabel med parametrar o = 3 och f3 = 10/9. Vad är sannolikheten att kullagret fungerar efter
a) 1 år?
b) 2 år?
4.14 Den stokastiska variabeln
a) P(e < 2), d) P(e>-1), f) P(e = 2). 4.15
eE N(0, 1). Beräkna
b) P({ < -1),
c) P(e > 3),
e) P(-l a) = 0.999, d) P(e > a) = 0.05.
4. Kontinuerliga fördelningar
4.16
121
Den stokastiska variabeln~ E N(l, 2). Bestäm a) P(~
< 3),
b) P(~ > 4),
c) P(~
< -1.5).
4.17 En maskin producerar metalltappar vars diameter måste understiga 1.5 tum för att vara användbara i produktionen. En statistisk undersökning har visat att tapparnas diameter kan betraktas som normalfördelad N(l.490, 0.005). a) Hur stor del av de tillverkade tapparna är användbara i produktionen? b) Tapparna förpackas i lådor om 50 stycken. Vad är det förväntade antalet användbara tappar per låda? c) Vad är standardavvikelsen för antalet användbara tappar per låda? 4.18
Låt ~ vara livslängden för ett tekniskt system. Låt F och f beteckna fördelnings- respektive frekvensfunktionen för ~. Med felintensiteten z(t) vid tiden t menas
J(t) z(t) = 1 - F(t) Visa med hjälp av definitionen på betingad sannolikhet, sid 57, och formel (4.1), sid 108, att P( t < ~ < t + D.t
I { > t)
~
z(t) · D.t.
Tolka innebörden av felintensitet. 4.19
Bestäm felintensiteten z(t) om
a) { E Exp(.>..). b) ~ är Weibullfördelad med parametrarna a och {3. För vilka värden på {3 är z(t) växande, konstant respektive avtagande funktion av t?
4.3
Väntevärde
Vi skall nu definiera väntevärde för en kontinuerlig stokastisk variabel {. För att motivera den definitionen resonerar vi på följande sätt. Låt { vara en ©
Studentlitteratur
4.3.
122
Väntevärde
kontinuerlig stokastisk variabel som antar värden i intervallet [a, b] och har frekvensfunktionen f. Dela upp intervallet [a, b] i n stycken delintervall av längd 6x 1, 6x 2, ... , Åxn och med delningspunkter x1 = a, x2, X3, ... , Xn, och Xn+l = b.
Figur 4.18
Formel (4.1), sid 108 ger P(xi
< ~ < Xi + Åxi)
~ f (xi)Åxi,
(4.2)
Nu approximerar vi den kontinuerliga stokastiska variabeln med en diskret stokastisk variabel, som antar värdena Xi, i = 1, 2, ... , n, med sannolikhet som ges i formel (4.2). Den diskreta stokastiska variabeln har då väntevärdet n
L xd(xi)Åxi, i=l
Men denna summa känner vi igen som Riemannsumman till en integral. Om nu n växer mot oo och samtidigt längden av det längsta delintervallet går mot O så gäller
Uttrycket i högra ledet ovan kallar vi väntevärdet för den kontinuerliga stokastiska variabeln ~ och gör följande definition.
Definition Låt ~ vara en kontinuerlig stokastisk variabel med frekvensfunktionen Då definieras väntevärdet för ~ som E(~)
©
Studentlitteratur
=
1-:
xf(x) dx.
f.
123
4. Kontinuerliga fördelningar
Anmärkning 4.1 Då f(x)
= 0 utanför intervallet E(~)
=
1b
[a, b] blir
xf(x) dx.
På samma sätt som i det diskreta fallet gäller att väntevärdet för ~ kan ses som en förutsägelse om det medelvärde man kan vänta sig om man gör ett stort antal observationer på~ och beräknar medelvärdet. Om man tolkar sannolikhetsfördelningen för ~ som en massfördelning på reella axeln, med massan P(a < ~ :s; b) på intervallet Ja, bl, så blir väntevärdet fördelningens masscentrum. Väntevärdet E(~) är alltså ett lägesmått som anger var massfördelningen eller sannolikhetsfördelningen ligger "i genomsnitt". Exempel 4.10 Låt ~ ha frekvensfunktionen
f(x) = {
x(6
-x)
36
Q :s;
,
0,
X
:s;
6
för övrigt
Bestäm väntevärdet för ~. Lösning: Frekvensfunktionen till ~ är symmetrisk kring 3 (se figur 4.19.). Fördelningens masscentrum är alltså 3. Därav följer att väntevärdet E(~) = 3.
Figur 4.19 Frekvensfunktionen i exempel 4.10.
Om vi räknar enligt definitionen så blir det
E(~)
1-:
1 6
x 316 x(6 - x) dx
xf(x) dx
=
6
x3 ) dx
_.!:_ / (6x 2 36 J0
-
= _.!:_ [2x 3 -
Exempel 4.11 Låt~ E Exp(>.). Bestäm väntevärdet för
36
x
= 4
4
]
6
= 3.
0
f ©
Studentlitteratur
124
4.3.
Väntevärde
Lösning: Frekvensfunktionen till { är
f(x)
={
' -.>.x
"e 0,
'
x:2'.0
för övrigt
Väntevärdet blir då
{Partiell integration}
ECJ)= V2 Q.fi
Figur 4.20 Exponentialfördelningen Exp(2).
Exempel 4.12 Om { E N (µ, a) så är frekvensfunktionen till { symmetrisk kring µ. Då är alltså E({) = µ. Se figur 4.21.
Ioo
-+--_._===::::::__ _ _-+-_ _ __ _ _ : ~ - ~ X E(i)=f Figur 4.21 Normalfördelningen N(µ, u).
© Studentlitteratur
4.
Kontinuerliga fördelningar
125
Övningar 4.20
Beräkna väntevärdet för~ om dess frekvensfunktion är
a) f(x) = {
0.5, 0 - 100 , måste vi känna till parametern >.. Hur gör vi för att få en bra skattning av den okända parametern >.? 177
7.1.
178
Inledning
Exempel 7.3 Vid lastning av malm i vagnar med en ny typ av lastmaskin vill man kunna bestämma hur stor andel av vagnarna som det tar mer än 2 minuter att lasta. Det kan vi inte göra utan ytterligare information om den fördelning som tidsåtgången för lastningen följer. Inte ens om vi kan anta att tidsåtgången är normalfördelad kan vi bestämma den sökta andelen. Vi måste ju känna värdena på parametrarna µ och a också.
För att skaffa information om de okända parametrarna upprepar vi det aktuella försöket ett antal gånger och mäter den storhet vi är intresserade av. I exempel 7.1 låter vi ett antal lysrör av den nya typen vara i bruk och undersöker om de fungerar efter 1000 timmar eller ej. I exempel 7.2 mäter vi livslängden hos ett antal likadana komponenter. I exempel 7.3 lastar vi ett antal vagnar med den nya lastmaskinen och studerar tidsåtgången. Utgående från den information vi får i sådana försök ska vi med hjälp av sannolikhetsresonemang studera hur bra eller säkra uppskattningar vi kan bilda. Innan man har gjort den aktuella undersökningen vet man inte vilka värden man får, så mätvärdena kommer att bero på "slumpen". Vi kan tänka oss dem som n oberoende stokastiska variabler ~1 ,~ 2 , ... ,~n med samma fördelning. Vi säger att ~1 , ~ 2 , ... , ~n är ett stickprov av storlek n. Med hjälp av mätvärdena bildar vi en uppskattning av den okända parametern. Eftersom mätvärdena beror av "slumpen" så kommer även uppskattningen att göra det. Uppskattningen betraktad innan försöket är utfört är alltså en stokastisk variabel (slumpvariabel) och kallas för en punktskattning av den aktuella parametern. (Ibland säger man bara skattning.) Efter det att man har gjort sina mätningar får man numeriska värden x 1,x2 , ... ,xn, som kan betraktas som observerade värden på ~1 ,~ 2 , ... ,~n- Vi säger att X1,x2, ... ,Xn är ett observerat stickprov av storlek n. Man får nu också ett numeriskt värde på uppskattningen. Detta numeriska värde kallas för en observerad (punkt)skattning. Exempel 7.4 Man är intresserad av livslängden hos en viss typ av rullager. Man vet att livslängden varierar och vill till att börja med få en uppfattning om den förväntade livslängden µ. I en första liten studie tänker man slumpmässigt välja ut 5 lager och mäta deras livslängd. Bestäm en eller flera tänkbara punktskattningar av µ. Lösning: Innan vi har börjat mäta livslängderna tänker vi oss att de kommande mätvärdena som ett stickprov ~1 ,~ 2 , ... ,~ 5 av storlek 5, dvs som 5 oberoende och likafördelade stokastiska variabler med väntevärde µ. Eftersom väntevärdet kan betraktas som ett "genomsnittsvärde" är det naturligt att bilda medelvärdet av mätvärdena som © Studentlitteratur
7.
Punktskattningar
179
en tänkbar punktskattning, dvs
µ;:
1 5 =€= 5 I:€i• i=l
En annan tänkbar skattning är medelvärdet av det minsta och största mätvärdet, dvs 1 µ2 = 2 (€(1) + €(5))' där €(1) betecknar det minsta och €(5) det största mätvärdet. Ytterligare en tänkbar skattning är det mittersta mätvärdet i storleksordning, dvs µ3 = €(3), där €(3) betecknar det mittersta värdet i storleksordning av de 5 mätvärdena. Vi skulle kunna fortsätta och ge ytterligare förslag på skattningar men nöjer oss med dessa tre. Exempel 7.5 Fortsättning på exempel 7.4. Sedan man valt ut 5 lager och testat deras livslängd fick man följande resultat. (Se tabell 7.1, sid 179.) Tabell 7 .1 Livslängd (i 10 cykler) hos 5 lager.
2.9
0.8
8.2
1.0
4.7
Beräkna observerade värden på de föreslagna skattningarna i exempel 7.4. Lösning: Här är x1 = 2.9, x2 = 0.8, X3 = 8.2, X4 = 1.0, X5 = 4.7 vårt observerade stickprov. Det observerade värdet av µi blir
µi obs = i
1
=
5
5 L Xi = 3.52. i=l
Eftersom det minsta värdet är x(l) = x2 = 0.8 och det största är x(5) = x 3 = 8.2 blir det observerade värdet av µ 2
µ2 obs=~ (x(l) + x(5))
= ~(0.8 + 8.2) = 4.5.
Det mittersta observationsvärdet i storleksordning är x(3) = och alltså är det observerade värdet av µ 3
µ3 obs = x(3) =
x1 =
2.9
2.9.
Vi ser att vi får ganska olika värden på skattningarna i de tre olika fallen. Vilken skattning skall man välja? Kan man säga att någon är "bäst" i någon viss bemärkelse? ©
Studentlitteratur
Punktskattningars fördelning
7 .2.
180
I exempel 7.4 och exempel 7.5 har vi infört en typ av beteckningar som vi kommer att följa i fortsättningen. Vi markerar alltså en_ punktskattning med en * och dess observerade värde med ~bs' tex µ* = ~ och µ~bs = x. Av exempel 7.4 och exempel 7.5 framgår att man behöver någon typ av egenskaper för att karakterisera en "bra" skattning. Vi skall strax studera två sådana egenskaper.
7 .2
Punktskattningars fördelning
Om man gör upprepade observerade stickprov på samma situation och vid varje upprepning beräknar samma skattning, så kommer de observerade värdena av skattningen att variera. Exempel 7.6 Betrakta åter försöket i exempel 7.4 och exempel 7.5, sid 178, att studera livslängden hos lager. Vi upprepar proceduren att välja ut 5 lager och testa deras livslängd. Efter varje upprepning beräknar vi µ~bs = x. Det observerade stickprovet vi fick i exempel 7.5 kallar vi nr 1. När vi upprepar proceduren får vi sedan observerat stickprov nr 2, 3 osv. Då kan det se ut så här. Tabell 7.2 Tabell med observerade stickprov.
Nr 1 2 3 4 5
Observerat stickprov 2.9 5.7 0.5 5.3 7.9
0.8 7.1 5.4 0.8 1.3
8.2 2.3 1.5 6.5 1.1
1.0 5.5 2.1 3.2 4.8
4.7 1.4 0.7 5.0 2.0
* µobs= X3.52 4.40 2.04 4.16 3.42
I verkligheten har man bara tillgång till ett observerat stickprov, tex nr 1 i exempel 7.6. Men man skall dock hela tiden tänka sig detta som ett stickprov utvalt från en tänkt mängd av alla tänkbara stickprov, som man skulle kunna få om man upprepade proceduren att skaffa mätvärden om och om igen. Detta sätt att tänka gör det lättare att se µ~bs som ett observerat värde på den stokastiska variabeln µ*. I många situationer kan det vara lättare att förstå stokastiska begrepp om man tänker sig att· man gör många upprepningar eller simuleringar. Nu kan man undra vilka värdenµ* =~kan komma att anta. Kan man säga någonting om hur mycket de kommer att variera? Det kan vi göra om vi kan bestämma fördelningen för punktskattningen eller om vi åtminstone kan beräkna skattningens väntevärde och standardavvikelse. Ibland är det enkelt © Studentlitteratur
7. Punktskattningar
181
att bestämma punktskattningars fördelningar. Om vi i exempel 7.4, sid 178, antar att { 1 , { 2 , •.• , { 5 är normalfördelade N(µ, a) så vet vi med hjälp av sats 6 D, sid 162, attµ*= E N(µ,a/vlf,). Men det är inte a:lltid man kan bestämma punktskattningens fördelning så enkelt som i det nämnda exemplet. Om man har tillräckligt stora stickprov och kan beräkna väntevärde och varians för punktskattningen, så kan man ibland bestämma en approximativ fördelning med hjälp av centrala gränsvärdessatsen. Numera finns även ett tredje alternativ om inget av de två övriga kan användas. Man kan nämligen simulera sin fördelning med hjälp av dator. Man simulerar då många observerade stickprov av en given storlek från en bestämd fördelning och beräknar skattningen för varje stickprov. Genom att sedan sammanställa alla observerade skattningar i ett histogram får man en uppfattning om punktskattningens fördelning. Man kan på det viset få en förståelse för hur olika skattningar uppför sig.
e
7 .3
Väntevärdesriktighet och effektivitet
Vi såg i exempel 7.4 och exempel 7.5, sid 178, att när man skall uppskatta en okänd parameter kan man bilda flera tänkbara skattningar. För att kunna avgöra vilken av skattningarna som är "bäst" i någon mening måste man bestämma vilka egenskaper man skall kräva av sin skattning. Två vanliga sådana egenskaper är väntevärdesriktighet och effektivitet. Vi börjar med väntevärdesriktigheten. Låt 0 vara en okänd parameter som vi skall skatta. (0 kan vara exempelvis µ i N(µ, a), a i N(µ, a), pi Bin(n,p) eller Å i Exp(Å).) Låt 0* beteckna punktskattningen av 0. Vi intresserar oss för hur fördelningen för 0* ligger i förhållande till 0. Det tycks naturligt att föredra en skattning 0* som "i genomsnitt hamnar i 0", dvs en skattning vars fördelning har 0 som väntevärde. (Jämför figur 7.1 och figur 7.2, på sid 182.) Vi gör nu följande definition.
Definition En punktskattning 0* av parametern 0 är väntevärdesriktig om E(0*)
= 0.
En väntevärdesriktig skattning ger alltså rätt värde "i genomsnitt" om man genomför ett stort antal försök. I exempel 7.4, sid 178, betraktade vi situationen att skattaµ utgående från ett stickprov { 1 ,{ 2 , •.. ,{ 5 av storlek 5. Vi föreslog 3 tänkbara skattningar ©
Studentlitteratur
182
7.3.
Väntevärdesriktighet och effektivitet
av µ nämligen
µi µ2
~, ~ (€(1) + €(5))
µ3
€(3) (det mittersta värdet i storleksordning).
(medelvärdet av det minsta och största värdet),
Eftersom E(~) = µ enligt sats 5 C, sid 141, så är µi = ~ alltid en väntevärdesriktig skattning av µ oberoende av fördelningen för €i. Om man dessutom antar att fördelningen för €i är symmetrisk så kan man visa att både µ 2 och µ 3 är väntevärdesriktiga skattningar av µ.
Figur 7.1 Frekvensfunktionen för 0• då 0• är en väntevärdesriktig skattning av 0.
Om vi alltså skall skatta väntevärdet µ till en symmetrisk fördelning så ser vi att alla tre skattningarna µi, µ 2 och µ 3 är väntevärdesriktiga. För att avgöra vilken vi skall välja, dvs vilken som är "bäst" studerar vi den andra nämnda egenskapen, dvs effektiviteten.
e Figur 7.2 Frekvensfunktionen för 0* då 0• är en icke-väntevärdesriktig skattning av 0.
Låt 0i och 02 vara två väntevärdesriktiga skattningar av parametern 0. ©
Studentlitteratur
7. Punktskattningar
183
0;
Om man skall välja mellan 0i och så är det rimligt att välja den som har störst sannolikhet att hamna nära 0, dvs den vars spridning är minst.
_j\ e Figur 7.3 Skisserade fördelningar för 0i och 02.
Vi gör följande definition
Definition Låt 0i och 0; vara två väntevärdesriktiga skattningar av en parameter 0. Om V(0i) < V(0;) säger vi att 0i är effektivare än 0;. Vilken av de tre betraktade skattningarna µi, µ 2 och µ 3 på sid 182 som är effektivast beror på vilken fördelning stickprovet kommer ifrån. Om exempelvis stickprovet kommer från en rektangelfördelning så kan man visa att medelvärdet av den minsta och största observationen, dvs µ 2, är den effektivaste skattningen av µ. (Jämför övning 7.4, sid 188.) Om man har ett stickprov från en normalfördelning så är~' dvs µi den effektivaste skattningen avµ. (Jämför övning 7.5, sid 189.) I exempel 7.1, sid 177, betraktades en situation där man behöver skatta p = P(ett lysrör fungerar efter 1000 timmar) i en binomialfördelning. Om vi gör försöket att mäta livslängden hos n lysrör så är relativa frekvensen av antalet lysrör som fungerar mer än 1000 timmar en naturlig skattning av p. Det är en väntevärdesriktig skattning av p. (Se övning 7.14, sid 192.) Man kan även visa att det är den effektivaste skattningen av p. Man är ofta intresserad av att skatta c, 2 eller c, i en fördelning. Vi fann i kapitel 1 att 2 1 I:n 2 s = -(xi -x)
n-l
i=l
är ett lämpligt spridningsmått för ett material. Vi kan uppfatta s som en observerad skattning av c,. En tänkbar punktskattning av c, 2 blir då
©
Studentlitteratur
184
Väntevärdesriktighet och effektivitet
7.3.
Exempel 7.7 Låt { 1 , { 2 , ... , { n vara ett stickprov från en fördelning med väntevärde µ och varians a 2 . Visa att (1
2·
1 L.,({i ~ = -n-1
-)2
{
i=l
är en väntevärdesriktig skattning av a 2 • Lösning: Eftersom n
n
I:({i - e)2
I : (({i - µ) -
i=l
i=l n
=
(e - µ))2 = n
I:({i - µ) 2 + n(e - µ) 2
-
2(e - µ) I:({i - µ) =
i=l n
i=l
I:({i - µ) 2 + n(e - µ) 2
-
2(e - µ) . n(e - µ) =
i=l
i=l
och n
=
n
LE(({i - µ) 2 ) = LV({i) = na2 , i=l
i=l
E( (e- E(e))
2 2
)
=
V(e)
= :
,
så blir
Alltså är
E(u'•)-E( n~
It({;-{)')- n~ 1 (n-1)u
-e)
2
-u'.
2 /(n-1) är en väntevärdesriktig I exempel 7.8 har vi visat att L~=l ({i 2 punktskattning av a oberoende av fördelningen för { 1 ,~2 , •.• ,~n· Det är detta som är anledningen till faktorn 1/(n - 1) i uttrycket för s 2 istället för den kanske intuitivt naturligare 1/n. Man kan visa att a 2 • = L~1 (~i /(n - 1) är den effektivaste skattningen av a 2 om stickprovet kommer från en normalfördelning.
e)2
©
Studentlitteratur
7.
Punktskattningar
185
Nu tycks det naturligt att som skattning av a välja
Tyvärr blir den inte väntevärdesriktig utan man får E(a*) = ena, där konstanten Cn beror av n och fördelningen hos ~1 , ~ 2 , ... , ~n och ofta får ett krångligt utseende. Men Cn är nära 1 och närmar sig snabbt 1 dån växer. Om stickprovet kommer från en normalfördelning gäller tex att c3 = 0.89, c5 = 0.94 och c10 = 0.97. För stora stickprov är alltså a* "så gott som" väntevärdesriktig. Som observerad skattning av a används därför ofta a~bs = s = .Jii. Detta kallas att skatta a med s-metoden. Vi ger följande tumregler vid skattning av µ, a 2 och a. Låt ~1 ,~ 2 , ... ,~n vara ett stickprov och x 1 ,x2, .. ,,Xn motsvarande observerade stickprov på en stokastisk variabel ~ med E(O = µ och V(~) = a 2 . Användbara punktskattningar och observerade skattningar är, oberoende av fördelning,
a*
= ~'
När vi behandlade spridningsmått för ett material i kapitel 1 så använde vi även variationsbredden R = x(n)-x(l), dvs skillnaden mellan största och minsta observationsvärdet. Den kan naturligtvis också ligga till grund för en punktskattning av a. Man kan visa att E(~(n) - ~(1)) = ana där On är en konstant som beror på stickprovsstorleken n och stickprovets fördelning. Det innebär att vi bildar
för att få en väntevärdesriktig skattning av a. Om stickprovet kommer från en normalfördelning fås följande värden på On, n = 2, 3, ... , 10. (Se tabell 7.3.) Tabell 7.3 Konstanten On då {1,{2, .. ,,en E N(µ,u).
n On
10 9 8 7 6 5 1.128 1.693 2.059 2.326 2.534 2.704 2.847 2.970 3.078 2
3
4
©
Studentlitteratur
Väntevärdesriktighet och effektivitet
7.3.
186
Den observerade skattningen baserad på R blir
Detta kallas att skatta
r7
med R-metoden.
Exempel 7.8 För att bestämma draghållfastheten för ett visst material gjordes en serie provbelastningar. Man mätte då brottgränsen, dvs den spänning (enhet: N/mm 2 ) då materialet brister, med resultatet:
358
357
379
382
393
361
371
380
391
378.
Mätvärdena kan betraktas som ett observerat stickprov från en N(µ, fördelning. Beräkna observerade skattningar av a) väntevärdet µ, b) standardavvikelsen c) standardavvikelsen r7 med R-metoden.
r7
r7)-
med 8-metoden,
Lösning:
a) Vi skattarµ med x och får 1 µ~bs
=X= 10
10
LXi = 375. •=1
b) För att skatta r7 med 8-metoden beräknar vi först formel (1.1), sid 9, dvs 82
=
82
och använder
1 1 3750 2) I:xt Lxi = (1407754 ) ( ) ( n-1 9 n 10 1
n
n
i=l
i=l
2
1504 -9-. Alltså blir vår observerade skattning av *
f7obs
r7
med 8-metoden
v
= 8 = /1504 - 9- = 12.927 ~ 12.9. 9
c) Eftersom mätvärdena är normalfördelade kan vi använda tabell 7.3 för att skatta r7 med R-metoden. Vi ser att n = 10 ger a 10 = 3.078. Eftersom det största observationsvärdet är x(lO) = 393 och det minsta är x(l) = 357 så blir R = 393-357 = 36: Den observerade skattningen av r7 beräknad med R-metoden blir alltså *
(7obs
© Studentlitteratur
= 8 = 3 _36 078 = 11.696 ~ 11.7.
187
7. Punktskattningar·
Om vi endast betraktar situationer där stickprovet kommer från en normalfördelning, vilken av R- och s-metoden ger den effektivare skattningen? Man kan visa att då gäller
och
v(
{(n) 0~ {(1))
= -y!u2 ,
där ön och 'Yn är tabellerad i tabellen nedan för vissa n-värden. 'Yn
2 3 4 5 6 7 8 9 10 11 12 14 15 20
0.603 0.463 0.389 0.341 0.308 0.282 0.262 0.246 0.232 0.220 0.210 0.194 0.189 0.161
0.756 0.525 0.427 0.371 0.335 0.308 0.288 0.272 0.259 0.248 0.239 0.224 0.217 0.195
0.798 0.882 0.911 0.919 0.919 0.916 0.910 0.904 0.896 0.887 0.879 0.835 0.862 0.826
Vi ser att s-metoden ger en skattning med mindre varians än R-metoden. Fördelen med R-metodens skattning är att den snabbt går att räkna ut. Den är också användbar som en preliminär skattning av u. R-metoden används exempelvis inom statistisk processtyrning.
Övningar 7.1
Man har gjort 9 mätningar x1, x2, ... , Xg som kan betraktas som ett observerat stickprov från en fördelning med väntevärde µ och varians u 2 . Både µ och u 2 är okända. Man fick E?=l Xi = 126.9 och E?=l x~ = 1921.29. Beräkna på lämpligt sätt en observerad punktskattning av a) µ, b) u 2 , c) u.
©
Studentlitteratur
188 7.2
7.3.
Väntevärdesriktighet och effektivitet
I ett mätinstrument används ett specialbatteri. För 5 batterier har man mätt hur lång tid de ger tillräcklig spänning och fått följande observationer (i tim): 5.1, 4.3, 6.5, 4.7, 7.2. De erhållna värdena kan ses som ett observerat stickprov på en stokastisk variabel ~ där E( ~) = µ och V (~) = a 2 . a) Beräkna observerade punktskattningar avµ och a på lämpligt vis. b) Bestäm standardavvikelsen för punktskattningen av µ och beräkna en lämplig observerad skattning av den.
7.3
Låt ~1 och ~2 vara ett stickprov på~' där E(~) =µoch V(~) = a 2 . Betrakta alla punktskattningar avµ som kan skrivas somµ* = a 1 ~ 1 + a2~ 2 . Hur skall a1 och a2 väljas för att µ* skall bli a) väntevärdesriktig? b) effektivast bland alla väntevärdesriktiga skattningar av den betraktade typen?
7.4
I exempel 7.4 och exempel 7.5, sid 178, föreslogs tre olika tänkbara skattningar av p, nämligen
µ;'.
~'
µ2
~ (~(1) +~(5))
µ3 =
~(3) (det mittersta värdet i storleksordning).
(medelvärdet av minsta och största värdet),
I tabellen nedan ges 10 observerade stickprov av storlek 5 simulerade från en och samma rektangelfördelning. a) Beräkna för vart och ett av stickproven de tre olika observerade skattningarnaµ;'. obs> µ 2obs och µ 3obs· (x-värdena är redan uträknade.) b) Jämför spridningarna mellan de tre olika skattningarna genom att beräknas för de 10 µ;'. obs-värdena, s för de 10 µ 2obs-värdena och s för de 10 µ 3obs-värdena. Vilken av de tre skattningarna verkar "bäst"? Tänk på att man i praktiken bara har ett stickprov. c) Vad tror Du att fördelningen som stickproven kommer ifrån har för väntevärde? ©
Studentlitteratur
7. Punktskattningar
189
Nr 1 -2 3 4 5 6 7 8 9 10
7.5
Observerat stickprov 2.85 2.83 2.89 2.76 3.48 3.46 3.19 2.86 3.33 2.91 3.22 3.44 3.12 2.86 2.65 3.41 2.88 3.03 2.82 2.83 2.88 2.69 2.73 3.25 2.66 3.38 3.10 3.42 3.23 2.77
x 3.20 3.49 2.97 2.77 3.14 2.74 2.77 2.51 3.01 3.33
2.96 3.22 3.02 3.07 2.93 3.08 2.81 2.80 2.99 3.17
I tabellen nedan ges 15 observerade stickprov av storlek 5 simulerade från en och samma normalfördelning. Genomför samma uppgifter som i 7.4 a)-c) men med den ändringen att det är 15 istället för 10 värden att beräkna s för i b).
Nr 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 7.6
3.05 2.92 2.76 3.01 2.86 3.35 2.80 2.83 2.78 3.08
69.96 70.45 71.20 69.83 71.36 67.79 65.59 71.16 62.91 69.48 71.59 65.22 72.34 67.07 73.08
Observerat stickprov 64.90 72.50 69.03 63.89 64.95 70.70 68.03 69.93 71.60 68.10 70.86 73.66 67.85 64.00 72.54 66.75 68.68 62.54 67.47 64.94 68.25 66.70 60.19 68.79 71.09 72.15 66.92 71.27 69.86 66.04 70.55 64.94 71.48 61.85 67.29 75.19 70.03 65.37 66.54 74.88 70.56 79.34 70.88 69.28 68.12
x 72.18 60.85 69.85 71.05 62.46 74.28 64.58 63.35 78.11 70.92 65.58 72.88 76.39 71.52 73.27
69.71 66.17 70.12 70.70 67.64 68.00 66.17 66.04 70.24 69.51 68.83 68.49 70.13 72.67 70.93
Vid fem smältpunktsbestämningar på en okänd substans fick man värdena 184.9 185.5 185.6 184.8 185.3 Värdena kan betraktas som ett observerat stickprov på en stokastisk variabel ~ E N (µ, a), där både µ och a är okända. Skatta a med a) s-metoden,
RäknehjäJp:
b) R-metoden.
I:~=l Xi = 926.1, I:~=l X~ = 171532.75. ©
Studentlitteratur
190
7.3. Väntevärdes-riktighet och effektivitet
7. 7
Vid en lätt betongfabrik uttogs 9 prov kroppar varefter densiteten (enhet: g/cm 3 ) bestämdes. Resultat: 0.518 0.506
0.510
0.507
0.510
0.508
0.511
0.501
0.493 .
Ange vilka antaganden som måste göras för att man skall kunna skatta a med R-metoden och tabell 7.3. Beräkna sedan den observerade skattningen med R-metoden. 7 .8
Tabellen nedan innehåller information från 10 observerade stickprov av storlek n = 15 simulerade från en och samma normalfördelning. a) Beräkna för vart och ett av stickproven en observerad skattning a~bs av a med R-metoden. b) Jämför spridningen mellan de 10 s-värdena och de 10 a~b 5 -värdena från a) genom att beräkna standardavvikelsen för s-värdena och standardavvikelsen för a~b 8 -värdena. Verkar resultatet rimligt? c) Vad tror Du att fördelningen som stickproven kommer ifrån har för standardavvikelse? Observerat stickprov nr 1 2 3 4 5 6 7 8 9 10
7.9
x(15)
x(l)
s
57.33 57.78 58.34 57.14 57.42 57.05 59.75 58.59 58.67 58.14
54.65 54.21 54.11 54.28 54.68 54.50 55.80 55.03 55.61 55.04
0.637 0.974 1.113 0.801 0.963 0.779 0.989 0.926 0.955 0.896
En viss arbetsoperation får inte ta mer än 40 sekunder. För att kontrollera om så var fallet mätte man den tid operationen tog och fick följande resultat (enhet: sek). 42 37
37 41
36 36
45 35
39 34
41 36
33 37
32 39
39 33
44 31
Skatta sannolikheten att operationen tar mer än 40 sekunder.
© Studentlitteratur
7.
191
Punktskattningar
7.10 En viss typ av elektronisk komponent har en livslängd~ sådan att~ E Exp(>-.) (enhet: tim). För att kunna uppskatta P(~ ::; 100) behöver vi känna>-.. (Jämför exempel 7.2, 177.) För att skatta).. mätte man livslängden på 20 sådana enheter och fick
124.3 161.5 168.3 6.2
34.8 234.5 147.8 145.1
54.5 81.1 30.1 142.1
312.5 163.2 5.1 501.8
95.3 339.2 30.1 334.0
a) Beräkna en tänkbar observerad punktskattning av >-.. (Ledning: E(>-.) = 1/>-..) b) Vad blir sannolikheten att en elektronisk komponent av det aktuella slaget går sönder inom 100 driftstimmar om vi räknar med skattningen i a) som >-.-värde? 7.11
Om vi skall skatta er 2 och känner väntevärdet µ verkar det rimligt att som skattning ta n
er22·
2 = k~ L..,(~i - µ) , k konstant i=l
istället för
Bestäm konstanten k så att erf blir en väntevärdesriktig skattning av er2. 7.12
När man har många observationer så kan man förbättra R-metoden vid skattning av er i N(µ, er)-fördelningen på följande sätt. Dela slumpmässigt in stickprovet i k olika grupper (som inte behöver vara lika stora). Bestäm sedan variationsbredden i varje grupp. Beteckna den med R 1 (~), R2(~), ... , Rk(~)- Som skattning av er tar man sedan (7.1) där ni är stickprovsstorleken i grupp nr i. Visa, genom att jämföra variansen för (~(n) - ~(1)) /a.n med variansen för er* i formel (7.1), att er* i (7.1) är effektivare än (~(n) - ~(1)) /a.n för n = 12, 14 medan det omvända råder för n = 8, 10. Dela lämpligen in i två lika stora grupper vid beräkning av er*. © Studentlitteratur
192
7.13
7.3.
Väntevärdesriktighet och effektivitet
Låt ~1,~ 2 , ... ,~n vara ett stickprov på~ E R(0,0). a) Bestäm konstanter an och bn så att
0i = an~
och 0; = bn max(~1, ~2, • • •, ~n)
blir väntevärdesriktiga punktskattningar av 0. b) Vilken av skattningarna i a) är effektivast? c) Beräkna observerade skattningarna då man erhållit mätvärdena 0.3
0.8
1.9 0.2
1.5
Ledning: Bestäm fördelningsfunktionen till
genom att utnyttja
P(~ 1 :S x,~ 2 :S x, ... ,~ 1 :S x) P(~ 1 :S x) · P(~ 2 :S x) · ... · P(~n :S x). 7.14 Betrakta exempel 7.1, sid 177. Där skall man uppskatta p = P(ett lysrör fungerar efter 1000 timmar). Man tänker mäta livslängden hos n lysrör och räkna antalet rör som kommer att räcka mer än 1000 timmar. Sedan skall p skattas med p* = relativa andelen lysrör som räcker mer än 1000 timmar.
a) b) c) d)
©
Bestäm fördelningen för p* . Visa att p* är en väntevärdesriktig skattning av p. Bestäm variansen för p* . Hur många lysrör måste man undersöka för att standardavvikelsen för p* skall vara högst 0.05? Ledning: Utnyttja att p(l - p) :S 1/4.
Studentlitteratur
8. Intervallskattning
8.1
Teckenintervall
Om man skall uppskatta en okänd parameter räcker det oftast inte att beräkna en punktskattning. Den säger ju ingenting om precisionen i skattningen. Men om man istället gör uppskattningen i form av ett intervall så kan man samtidigt ge information om säkerheten. I detta kapitel ska vi studera några olika metoder att bilda intervallskattningar. Vi börjar med en metod som inte kräver något antagande om någon speciell fördelning.
Exempel 8.1 Man skall studera spräckhållfastheten hos svensk Bohusgranit. Man kommer i en första liten studie att mäta ett antal provbitar av graniten alla med samma givna längd och samma givna diameter. Man vet att spräckhållfastheten kommer att variera och vill i den här första omgången få en uppfattning om "den genomsnittliga" spräckhållfastheten. Med detta menar man det värde som i långa loppet hälften av prov bitarnas spräckhållfasthet kommer att understiga, dvs medianen för spräckhållfastheten. Man är inte nöjd med enbart ett värde på "den genomsnittliga" spräckhållfastheten utan vill ha en uppskattning i form av ett intervall, som med viss säkerhet kommer att innehålla "den genomsnittliga" spräckhållfastheten. Vi skall nu se hur man kan resonera sig fram till en enkel typ av intervallskattning, som efterfrågas i exempel 8.1. Om vi låter ~ vara spräckhållfastheten hos provbitarna av granit i exempel 8.1 så är "den genomsnittliga" spräckhållfastheten just medianen, m, för~- Vid den första studien vet man för lite om hur spräckhållfastheten kommer att variera och kan därför inte anta att ~ har någon bestämd fördelning. Det enda man kan säga är att ~ är en kontinuerlig stokastisk variabel, som antar värden i intervallet ]O, oo[, och har någon fördelningsfunktion F. Problemet är nu att bestämma ett intervall, som innehåller m med en sannolikhet som vi kan beräkna. Antag att vi skall mäta spräckhållfastheten hos 5 likadana provbitar. Låt ~ 1 , ~ 2 , ~ 3 , ~ 4 och ~5 vara de stokastiska variabler som betecknar spräckhållfastheten vid de 5 mätningarna innan vi gjort dem. Då har ~ 1 , ~ 2 , ... , ~ 5 alla samma fördelning som ~, dvs de har alla fördelningsfunktionen F och 193
8.1.
194
Teckenintervall
medianen m. Vi gör mätningarna på sådant sätt att ~1 , ~ 2 , ... , ~ 5 kan betraktas som oberoende stokastiska variabler. Med andra ord är ~ 1 , ~ 2 , ... , ~ 5 ett stickprov av storlek 5. Hur kan vi utgående från de 5 mätvärdena ~1 , ~ 2 , ... , ~ 5 bilda ett intervall som uppskattar parametern m? Ett tänkbart intervall är det som har det minsta och det största av mätvärdena som intervallgränser. Nu vet vi inte i förväg vilken av ~ 1 , ~ 2 , ... , ~ 5 som ger det minsta värdet eller vilken som ger det största värdet. Därför inför vi beteckningen ~(1) för den stokastiska variabel vars utfall är det minsta av utfallen hos ~1 , ~ 2 , ... , ~ 5 och ~(5) för den stokastiska variabel vars utfall är det största av utfallen hos ~1 , ~ 2 , ... , ~ 5 . Det tänkbara intervallet blir då [~ (1), ~ (5)]. Detta får bli vår intervallskattning av medianen, m, för~ . Sannolikheten, P (~(1):::; m:::; ~(5)), att intervallskattningen skall innehålla medianen m kallas intervallskattningens konfidensgrad. Vi skall nu bestämma konfidensgraden för intervallet [~(1),~(5)]. Vi börjar med att bestämma sannolikheten att intervallet inte innehåller m. Intervallet innehåller inte m om det hamnar till vänster om m eller till höger om m.
J(S)
m
Figur 8.1 Intervallet till vänster om m.
Sannolikheten att intervallet hamnar till vänster om m är
P(~(l) < ~(5) < m)
P(alla ~i < m)
=
P(~ 1 < m,~ 2 < m, ... ,~ 5 < m) = P(~ 1 < m) · P(~ 2 < m) · ... · P(~ 5 < m), ty ~1 ,~2 , ... ,~5 är oberoende stokastiska variabler. Men P(~i eftersom m är median för ~i> i = 1, ... , 5. Alltså blir
< m) = 0.5
P(~(l) < ~(5) < m) = 0.5 5 . På motsvarande sätt fås sannolikheten att intervallet hamnar till höger om m till
P(m < ~(1) < ~(5))
P(alla =
~i
> m) =
P(~ 1 >m,~ 2 >m, ... ,~ 5 >m)= P(~ 1 > m) · P(~ 2 > m) · ... · P(~ 5 > m) = 0.5 5 .
Figur 8.2 Intervallet till höger om m.
© Studentlitteratur
8. Intervallskattning
195
Konfidensgraden för intervallet [~(1),~(5)] blir då
P(~(l) < m < ~(5)).
1- [P(~(l) < ~(5) < m) =
1 - [0.5 5
+ 0.55 ]
+ P(m < ~(1) < ~(5))] =
= 0.9375.
Intervallet [~(1),~(5)] är alltså en intervallskattning av m med konfidensgraden 93.75%. Det betyder att intervallet [~(1),~(5)] innehåller parametern m (eller täcker över m) med sannolikhet 0.9375. Sedan vi gjort mätningarna på provbitarna så får vi observerade värden på spräckhållfastheten. Då kan vi bilda en observerad intervallskattning [~(1),~(5)] av parametern m. Denna observerade intervallskattning kallas för konfidensintervall för m med konfidensgrad 93. 75%. När man anger ett konfidensintervall måste man alltid ange konfidensgraden samtidigt. Exempel 8.2 Efter 5 mätningar på Bohusgraniten fick man följande värden på spräckhållfastheten (enhet MPa ): 9.3, 8.1, 11.2, 8.8, 6.7. Vi ser att det minsta värdet är x(l) = 6.7 och det största är x(5) = 11.2. Intervallet [6. 7, 11.2] blir alltså ett 93. 75% konfidensintervall för m. När vi bestämt ett konfidensintervall, som i exempel 8.2, kan vi säga att intervallet [6.7, 11.2] innehåller m med 93.75% konfidens eller säkerhet. Med det menas då att vi har använt en metod att bestämma intervallet som, om försöket upprepas många gånger, kommer att ge intervall som innehåller m i ungefär 93. 75% av fallen. Vi kan tänka oss att vi upprepar försöket att mäta spräckhållfastheten hos 5 provbitar granit många gånger. Efter varje gång vi fått 5 mätvärden bildar vi intervallet [x(l), x(5)]. På så sätt får vi många konfidensintervall [x(l),x(5)]. Ritar vi ut dem kan det se ut som i figur 8.3.
rn I
I
I
Figur 8.3
© Studentlitteratur
8.1.
196
Teckenintervall
Håller vi på tillräckligt länge så kommer 93. 75% av intervallen att täcka över m och 6.25% av intervallen att missa m. Vi kommer att ha tillgång till ett av alla dessa intervall av vilka 93. 75% innehåller m. Man kan naturligtvis bilda intervallskattningar och konfidensintervall för andra parametrar än medianen. Allmänt gäller följande definition. Definition En intervallskattning för en parameter är ett intervall med stokastiska variabler som gränser. Konfidensgraden för intervallskattningen är sannolikheten att intervallet skall innehålla parametern i fråga. Den observerade intervallskattningen kallas för konfidensintervall för parametern. När vi på sid 194 startade diskussionen om en tänkbar intervallskattning av m hade vi också kunnat välja det näst minsta och det näst största av mätvärdena som intervallgränser, dvs intervallet [~(2), ~(4)]. Här betyder naturligtvis ~(2) den stokastiska variabel vars utfall är det näst minsta av utfallen hos ~1, ~2 , ... , ~ 5 och ~(4) den stokastiska variabel vars utfall är det näst största av utfallen hos ~1,~2 , ... ,~ 5 . Vi beräknar nu konfidensgraden för intervallskattningen [~(2),~(4)]. Intervallet hamnar till höger om m om det näst minsta mätvärdet blir större än m. Det är samma sak som att högst ett mätvärde blir mindre än m. Eftersom de fem mätvärdena är oberoende stokastiska variabler så är antalet mätvärden mindre än m en binomialfördelad stokastisk variabel med parametrar n = 5 och p = P(~i < m) = 0.5. Sannolikheten att högst ett mätvärde blir mindre än m är därför
(5)
(5)
0 0.5 o · 0.5 5 + l 0.5 1 · 0.5 4 = 6 · 0.55 = 0.1875.
På samma sätt får vi att sannolikheten att intervallet hamnar till vänster om m också är 6 • 0.5 5 . Konfidensgraden är alltså
P(~(2) < m < ~(4))
= 1- (6 · 0.5 5 + 6 · 0.55 ) = 1- 12 · 0.5 5 = 0.625.
Exempel 8.3 Fortsättning på exempel 8.2 sid 195. Efter 5 mätningar på Bohusgraniten fick man följande värden på spräckhållfastheten (enhet: MPa): 9.3, 8.1, 11.2, 8.8, 6.7. Det näst minsta värdet är x(2) = 8.1 och det näst största är x(4) = 9.3. Intervallet [8.1, 9.31] är alltså ett 62.5% konfidensintervall för m. Det kan vi uttrycka som att med 62.5% säkerhet kommer intervallet [8.1, 9.31] att innehålla medianhållfastheten m . . Om vi välj~r intervallet [~(2),~(~)] istället för intervallet [~(1),~(5)] får v1 ett kortare mtervall, men samtidigt minskar konfidensgraden. Eftersom konfidensgraden är intervallskattningens träffsannolikhet vill man att den ©
Studentlitteratur
8. Intervallskattning
197
skall vara ganska hög. Vanligt är att den tas till 95% eller 99%. Hur skall vi då göra för att få ett kortare intervall och fortfarande hålla konfidensgraden hög? Ett sätt är att öka antalet mätvärden. Vi lämnar den frågan just nu men återkommer senare till den. Med samma resonemang som tidigare kan man bilda intervallskattningar med på förhand bestämd konfidensgrad för godtyckligt antal observationsvärden genom att använda lämpliga storleksordnade variabler. Om man tex vill ha en intervallskattning av m med konfidensgrad nära 95% och har 17 observationsvärden så kan man välja intervallet [~(5), ~(13)]. Med motsvarande resonemang som ovan kan vi visa att intervallet har konfidensgrad 95 .1 %. Den typ av intervallskattning vi bildat här kallas teckenintervall eftersom det enda som bestämmer om intervallskattningen träffar medianen eller ej är tecknen på skillnaderna mellan observationerna och medianen. Teckenintervallet kan användas oberoende av vilken fördelning de kontinuerliga stokastiska variablerna har. Sådana statistiska metoder, som inte kräver att fördelningen är känd, kallas icke-parametriska (eller fördelningsfria) statistiska metoder. I nästa avsnitt skall vi se hur man kan bilda intervallskattningar om man kan anta att observationerna följer en normalfördelning.
Övningar 8.1
Följande mätserier är upprepade observationer på 6 oberoende och likafördelade kontinuerliga stokastiska variabler med median m. Beräkna för varje mätserie ett 96.9% konfidensintervall för m. Rita sedan upp intervallen som på sid 195. Mätserie 1 2 3 4 5
8.2
18.88 19.79 3.68 1.66 14.91
2.23 6.65 15.17 2.19 0.53
Mätvärden 15.31 7.50 4.00 19.59 5.50 19.87 6.91 15.82 0.43 18.66
8.23 0.92 10.15 9.39 11.00
12.96 3.33 6.18 18.97 0.36
Man har undersökt brottgränsen för ett visst material vid engångsbelastningar. Vid ett experiment med 12 prov uppmättes följande värden: 117.1 116.5 115.9 116.8 117.7 115.6 115.9 116.9 116.7 117.1 116.4 115.0 Mätvärden kan antas vara observerade värden på oberoende och likafördelade kontinuerliga stokastiska variabler. Bestäm ett konfidensintervall för "medianbrottgränsen" med konfidensgrad så nära 95% som möjligt. Ange den exakta konfidensgraden. ©
Studentlitteratur
198
8.1. Teckenintervall
8.3
Vid bestämning av hållfastheten hos ett visst byggmaterial fick man följande observationer: 111,115,113,117,112,119,109,120. Betrakta dessa som observerade värden på oberoende och likafördelade stokastiska variabler. Bestäm ett 93% konfidensintervall för "medianhållfastheten".
8.4
Vad blir konfidensgraden om man i övning 8.3 använder intervallskattningen [~(1), ~(8)]?
8.5
Bestäm antalet observationsvärden n, där n > 11, som behövs för att intervallskattningen [~(6), ~(n - 5)] av m skall få en konfidensgrad på (minst) 90%.
8.6
Ett företag överväger att börja tillverka bromsbackar i ett nytt material som förmodas ge större livslängd. För att pröva detta tillverkas 16 backar vilkas livslängd mäts. Man vill redovisa resultatet av provet i form av ett konfidensintervall för medianlivslängden. En konfidensgrad av 98% eftersträvas. Konstruera en intervallskattning som uppfyller dessa krav och ange det konfidensintervall som erhålles om mätresultaten blir följande: 16.3 16.2
14.9 15.3
13.7 19.2 22.4 17.4
15.6 17.3
15.4 15.2 15.9 16.3
14.7 20.9
Mätvärdena kan betraktas som ett observerat stickprov från en kontinuerlig fördelning. 8. 7
Man har undersökt livslängden hos en viss typ av turbinblad. Vid ett försök med 10 turbinblad fick man följande livslängder (enhet: driftstimmar): 500
210 360 320 480
140 290
520
300 420.
Betrakta mätvärdena som ett observerat stickprov från en kontinuerlig fördelning. Bestäm ett konfidensintervall för "medianlivslängden" med konfidensgrad så nära 90% som möjligt. Ange den exakta konfidensgraden.
©
Studentlitteratur
8. Intervallskattning
199
Konfidensintervall förµ i N(µ, a)
8.2
Om vi endast vet att vårt stickprov kommer från en kontinuerlig fördelning och inte vet vilken fördelning, så kan vi bilda konfidensintervall med hjälp av någon icke-parametrisk metod, som tex teckenintervallet i avsnitt 8.1. Men har vi mer information och vet vilken fördelning stickprovet kommer ifrån så kan vi utnyttja det för att bilda "bättre", dvs kortare, konfidensintervall för tex µ. Vi skall i detta avsnitt bestämma konfidensintervall för µ om vi har ett stickprov från en N(µ, a)-fördelning. Vi måste ta hänsyn till om parametern a är känd eller okänd och behandlar därför dessa fall var för sig.
8.2.1
a känt
I exempel 1.8, sid 5, beskrivs ett försök där man studerar livslängden hos elektroniska komponenter, som används i sjukhusutrustning. Varje ny sändning av komponenter kontrolleras. Av erfarenhet efter en längre tids kontroll vet man att de enskilda komponenternas livslängder (i timmar) kan betraktas som observationer från en N(µ, a)-fördelning. Man är intresserad av att hålla kontroll över den förväntade livslängden µ. Man kan av erfarenhet anta att a = 12, dvs a är känt, men µ är okänt. När man får in en ny sändning vill man göra en skattning av µ. Antag att man ämnar livslängdstesta n slumpmässigt utvalda komponenter. Låt €1 , €2 , ... , €n beteckna livslängderna hos dessa n komponenter. Vi kan då anta att €1 ,€2 , ... ,€n är oberoende och alla € E N(µ, 12). Från kapitel 7.3 sid 183 vet vi att "den bästa" punktskattningen av µ är €, men eftersom punktskattningen inte säger något om skattningens precision vill vi bilda en intervallskattning av µ med konfidensgrad 95%. Då verkar det rimligt att bilda ett intervall runt €och bestämma gränser €- a och €+ b så att intervallet [€ - a, €+ b], innehåller µ med 95% sannolikhet, dvs P(€ - a < µ < €+ b) = 0.95. Vidare försöker vi göra intervallskattningen så att sannolikheten att den missar µ till höger är lika stor som sannolikheten att den missar µ till vänster. Det betyder att vi skall bestämma a och b så att () 0.05 0 025 P(€- - a > µ) = -0.05 2- = 0.025 och P € + b < µ = - 2- = . • Eftersom
_
€E N(µ, 12/ fo) _
enligt sats 6 D, sid 162, får vi
P(€- a > µ) = P(€ > a + µ) = p
( 12/fo €- µ
..___,
a ) = p (17 > ~ afo) .
> 12/fo
=ryEN(O,l)
©
Studentlitteratur
8.2. Konfidensintervall förµ i N(µ, a)
200
Ur normalfördelningstabellen får vi att denna sannolikhet är 0.025 om (se figur 8.4) 12 a.Jii, = 1.96 dvs a = 1.96 · .Jii," 12 '
area 0.025
1 Figur 8.4 N(O, !)-fördelningen.
På samma sätt får vi
P(l +b < µ) = P( ...._,__... l~/fo < -~r) = P(11 < - b~), ='7EN(O,l)
vilken blir 0.025 om (se figur 8.4)
- b.Jii, = 12
-1.96
'
dvs 12
b = 1.96 · .Jii,' En intervallskattning avµ baserad på l, med konfidensgrad 0.95, blir då
Vi får alltså ett intervall symmetriskt kring l vilket beror på att fördelningen för l är symmetrisk och att sannolikheten att intervallet missar µ till höger är lika stor som sannolikheten att det missar µ till vänster. Man kan göra om resonemanget ovan med standardavvikelsen a, där a är något i förväg känt tal, istället för 12 och konfidensgrad a, istället för 0.95. Man får då
a = b= © Studentlitteratur
(T
>.. 0 ;2 ·
.Jii,,
8. Intervallskattning
201
där betydelsen av >.. 0 ; 2 framgår av figur 8.5. Då gäller att
[~- -
>-a.;2 .
(1-
(1]
In,~ + >-a./2 . In
är en intervallskattning avµ med konfi.densgrad 1 - a.
Figur 8.5 N(O, 1)-fördelningen.
Om vi efter gjorda mätningar får observationerna x 1, x2, ... , Xn på de stokastiska variablerna ~1 ,~2 , ... ,~n blir x ett observerad värde på~ och intervallet [ i; -
In' x + >..
>.. /2 · _!!___ 0/.
/2 · 0/.
_!!___] In
(8.1)
blir ett konfi.densintervall för µ med konfi.densgrad 1 - a. Exempel 8.4 Antag att de 80 mätvärdena i exempel 1.8, sid 5, är observationer på ~1 ,~ 2 , ... ,~ 80 i den ovan beskrivna situationen, där ~i EN(µ, 12). Bilda ett konfidensintervall förµ med konfidensgrad a) 0.95, b) 0.99. Lösning:
a) Från exempel 1.8 får vi x = 81.55. Av resonemanget ovan ser vi att ett 95% konfidensintervall för µ är 12 12 ] [x - 1.96 y'SO' x + 1.96 · y'80 , dvs 12 12 ] [81.55 - 1.96 · v'80, 81.55 + 1.96 · v'80
,
dvs [78.9203, 84.1797]. Vi bör naturligtvis inte svara med så många decimaler i intervallgränserna eftersom vi då ger ett intryck av falsk noggrannhet. Det ©
Studentlitteratur
8.2.
202
Konfidensintervall förµ i N(µ, a)
är lämpligt att svara med en eller två decimaler eftersom mätvärdena bara är angivna med en decimal. Vid avrundningen gäller regeln att intervallgränserna avrundas så att intervallet inte minskas. Det innebär att den nedre gränsen avrundas nedåt och den övre uppåt. Då kommer konfidensgraden alltid att vara minst den angivna. Vårt svar blir då att intervallet [78.9, 84.2] är ett 95% konfidensintervall för µ. b) För att få konfidensgraden 0.99 måste vi bestämma >.. 0 ;2 = >..0.005. Ur tabell får vi >.. 0 _005 = 2.5758. Det 99% konfidensintervallet blir då 12 12 ] [81.55 - 2.5758 · J86, 81.55 + 2.5758 · J86 , dvs [78.094, 85.006] . Om vi avrundar så att intervallet inte minskar får vi att intervallet [78.0, 85.1] är ett 99% konfidensintervall förµ. Resultatet i exempel 8.4 b) säger att intervallet [78.0, 85.1] med 99% säkerhet innehåller den "genomsnittliga" livslängden µ. Om någon påstår att µ är 90, så kan vi svara att utgående från de mätningar som gjorts verkar detta inte troligt eftersom det 99% konfidensintervallet inte innehåller 90. Av exempel 8.4 och formel (8.1) framgår att ju högre säkerhet vi kräver av vårt konfidensintervall desto bredare blir det. Av formel (8.1) ser vi att konfidensintervallets längd är
Ju fler observationer vi har desto kortare intervall får vi alltså. Om vi för given konfidensgrad exempelvis vill minska intervallängden till hälften så måste vi göra 4 gånger så många observationer.
8.2.2
a okänt
Om a är okänt så kan vi inte längre använda konfidensintervallet i (8.1) eftersom vi inte har något värde på /J att sätta in. Men man borde kunna bilda ett konfidensintervall för µ genom att skatta 1J på lämpligt sätt. Det går men man kan inte bara stoppa in skattningen av 1J i formel (8.1), ty förutsättningarna för dess härledning har nu ändrats. Eftersom en ytterligare osäkerhet kommer in då 1J måste skattas bör detta visa sig i konfidensintervallets säkerhet om man bara ersätter 1J i formel (8.1) med en skattning av /J. För att bilda ett konfidensintervall för µ med given konfidensgrad 1 - a måste då troligtvis >.. 0 ; 2 bytas ut mot någon annan (större) konstant k. ©
Studentlitteratur
8. Intervallskattning
203
Låt a* vara en skattning av a. Vi försöker nu bestämma konstanten k så att intervallet
[~-k- ~,~+k· ~] blir en intervallskattning av µ med konfidensgrad 1 - a. Intervallet skall då missa µ med sannolikheten a, dvs P ( ~-
a* + k . fo, < µ)
=
a
och
2
a* P (-~ - k · fo,
> µ)
=
a
2.
Om vi skriver om detta får vi
För att kunna bestämma k måste vi känna fördelningen för
Dess fördelning är inte en normalfördelning. Eftersom både ~ och a* beräknas utifrån samma stickprov kommer både ~ och a* att variera om vi tänker oss upprepade stickprov, till skillnad från då a är känt och enbart ~ varierar. Nu kan man visa att om a skattas meds-metoden, dvs
a*
så har
~- ~
a* 1yn
=
en känd fördelning, som kallast-fördelning med n - l frihets-
grader. Vi skriver
~-µ
~ E
a* I yn
(8.3)
t(n-1).
Frekvensfunktionen för en t(n-1)-fördelad stokastisk variabel är
f(x) = kn
(l + n ~2l )-n/2 ,
-
00
0 är värdena som fås med metod B i genomsnitt större än då metod A används. Om ~ < O ©
Studentlitteratur
8. Intervallskattning
211
så gäller det motsatta. För att påstå att metoderna skiljer sig åt i genomsnitt skall vi alltså kunna påstå att Å =/ 0. (Se figur 8.8.)
A
A Figur 8.8
Vi har här 11 okända parametrar µ 1 ,µ 2 , ... ,µ 8 , o- 1 , o- 2 samt Å och vill bilda konfidensintervall för Å. Vi har alltså ett stort antal parametrar, som vi inte är intresserade av. Vi kan emellertid eliminera alla µi och ta ihop o- 1 och ..°';2a ✓ 1 + 1 ] . [x - y - >..°';2a ✓ n1 n2 n1 n2
Om vi drar parallellen med fallet då vi har ett stickprov så skall vi skatta a på lämpligt sätt och sedan ersätta >..°';rvärdet med något lämpligt t°';rvärde. Om vi låter a* vara en punktskattning av a bildad så att dess observerade värde är (n1 - l)sf n1 -1
+ (n2 - l)s~ + n2 -1
så kan man visa att
~ - fJ -
(µ 1 - µ 2) E t(n1 - 1 + n2 - 1).
a*J...!... n1
(8.7)
+ ...!... n2
Med samma resonemang som i fallet med ett stickprov, sid 202, finner man att en intervallskattning för µ 1 - µ 2 med konfidensgrad 1- a är
©
Studentlitteratur
8.3.
216 Ett konfidensintervall för µ 1
-
Jämförelser mellan två väntevärden . ..
µ 2 med konfidensgrad 1 - a, blir alltså
I detta exempel är n 1 = n 2 = 7. Från exempel 8.8 får vi a~bs = 0.9524 och x = 21.714 samt y = 33.643. Vi bildar ett 95% konfidensintervall. Eftersom to.025(12) = 2.18 får vi [21.714 - 33.643 - 2.18 ·
0.9524✓~ + ~ ,
21.714 - 33.643 + 2.18 ·
0.9524✓~ + ~
l·
Ett 95% konfidensintervall för µ 1 - µ 2 blir således [-13.1, -10.8]. Eftersom detta intervall inte innehåller 0 så kan vi med 95% säkerhet påstå att det är skillnad på den genomsnittliga hållfastheten. Med 95% säkerhet kan vi även säga att med 7 dagars härdningstid så är den genomsnittliga hållfastheten mellan 10.8 och 13.1 kp/m 2 större än med 2 dagars härdningstid.
Aven om vi har gjort normalfördelningsantaganden i både fallet två stickprov och i fallet stickprov i par så skiljer sig de två situationerna väsentligt åt. Det är viktigt att vara medveten om vilken modell som ska användas i vilken situation, eftersom resultaten kan bli mycket olika beroende på om man analyserar sina data enligt två stickprov eller stickprov i par. Vid två stickprov antas att ~ 1 , ~ 2 , ... , ~ni
är ett stickprov på N(µ 1 , a)
1/ 1, 1/2, ... , 1/n 1 är ett stickprov på N (µ 2 , a)
och att stickproven är oberoende.
Vid stickprov i par antas att vi har parvisa observationer (~i' 1/i), i 1,2, ... ,n,där ~i
E
N(µi, a1)
och att paren (~ 1 ,TJ 1 ), ©
Studentlitteratur
och
1/i E N(µi
(~ 2 ,11 2 ), ... ,
+ il, a2), i= 1, 2, ... , n
(~n,1/n) är oberoende.
=
217
8. Intervallskattning
Den viktiga skillnaden är att vid fallet med två stickprov måste alla €i ha samma väntevärde medan vid fallet med stickprov i par får väntevärdena för €i vara olika. Motsvarande gäller för T/i· Om dessutom standardavvikelserna för €i och T/i är okända måste de kunna antas vara lika vid situationen med två stickprov medan de tillåts vara olika vid stickprov i par. Vid två stickprov kan vi ha olika många observationer €i och TJ; vilket inte går vid stickprov i par. Slutligen måste €i och T/i vara oberoende vid situationen med två stickprov medan ett visst beroende kan tillåtas vid stickprov i par. Om vi har en situation med två oberoende stickprov där standardavvikelserna är okända och olika så går det inte att resonera som tidigare. Problemet är att det inte finns något entydigt bästa sätt att "väga ihop" skattningarna av standardavvikelserna. Ännu finns inte något "bästa sätt" att bilda konfidensintervall för µ 1 - µ 2 i en sådan situation. Det finns några olika approximativa lösningar som vi inte går in på här.
Övningar 8.22
Man ville undersöka sänkningen av blodtrycket (enhet: mm Hg) vid användning av ett visst preparat. Man mätte blodtrycket på var och en av 10 försökspersoner, gav därefter varje person en viss dos av preparatet (samma dos för alla) och gjorde efter 20 minuter ytterligare en blodtrycksmätning per person. Antag att mätresultatet före (xi) och efter (Yi) behandlingen på person nr i är N(µi, ai) respektive N(µi + ~, 0-2)a) Tolka parametrarna µ 1 , µ 2 , ..• , µ 10 och ~b) Som försöksresultat fick man person
1 75 80
2 70 70
3 85 75
4 80 65
5 100 95
6 80 70
7 65 80
8
9
70 75
90 65
10 100 90
Bilda ett 95% konfidensintervall för ~- Tycks preparatet vara effektivt som blodtr ckssänkande medel? Räknehjälp: (yi - xi) = -50, (yi - xi) 2 = 1450.
r::=l6
8.23
r::~1
Vid en undersökning av alkohols inverkan på reaktionstiden på 6 slumpvis utvalda personer fick man följande resultat (tid i sekunder) person före alkohol (x;) efter alkohol (Yi)
1 0.15 0.55
2 0.10 0.60
3 0.10 1.00
4 0.25 0.55
5 0.25 0.55 ©
6 0.05 0.35
Studentlitteratur
8.3.
218
Jämförelser mellan två väntevärden . ..
Antag att mätningen före och efter alkohol på person nr i är observation från N(µi, e7i) respektive N(µi + ~, e7 2 ). Beräkna ett 95% konfidensintervall för~- Vad kan man säga om reaktionstiden? 8.24 För att jämföra förslitningen hos bildäck av två typer, A och B, monterade man ett däck av vardera typen på bakhjulen på fem bilar av samma märke. Varje bil kördes 1000 mil. Därefter uppmättes följande förslitningar:
Typ av däck A B
Förslitning i mm hos bil nr 1 2 3 4 5 1.0 0.9 0.7 1.5 0.5 0.9 0.7 0.8 1.2 0.5
Bestäm ett 95 % konfidensintervall för skillnaden mellan den genomsnittliga förslitningen hos däck av typ B och den genomsnittliga förslitningen hos däck av typ A för det använda bilmärket. Eftersom förslitningarna av A- och B-däcken på en viss bil beror av förarens körstil, vilken typ av vägar han kör på etc, är det knappast rimligt att antaga att observationerna för en däckstyp har samma väntevärde. Lös uppgiften under rimliga normalfördelningsantaganden. Det skall klart framgå vilka dessa är. 8.25 a) För att undersöka om en viss medicin har bieffekten att höja blodtrycket mättes blodtrycket dels på 50 personer som ej behandlats med medicinen (mätvärden x 1 , x 2 , ... , x 5o) , dels på 25 patienter som behandlats med medicinen (mätvärden Y1, Y2, ... ,Y25). Man erhöll x = 148.2 y = 151. 7 Sx = 10.0 Sy = 8.0
Bestäm ett 95% konfidensintervall för skillnaden mellan förväntat blodtryck för de två grupperna under normalfördelningsantagande. Ange alla antaganden om fördelning. b) Resultatet av undersökningen i a) blev dåligt såtillvida att konfidensintervallet blev alldeles för brett för att man skulle kunna dra några intressanta slutsatser. En konsulterad statistiker föreslog att man skulle göra ett nytt försök, i vilket man mätte blodtrycket före och efter behandling på 25 patienter (mätvärden Xi i resp Yi, i = 1, 2, ... , 25). Man erhöll
x = 149.0 y = 150.9 z = 1.9 Sx
©
Studentlitteratur
= 8.1
Sy
= 9.5
Sz
= 1.6
8. Intervallskattning
219
där Zi = Yi -xi, i = 1, 2, ... , 25. Bestäm ett 95% konfidensintervall för skillnaden mellan förväntat blodtryck efter och före behandlingen under normalfördelningsantagande. Ange alla antaganden om fördelning. 8.26 Driftstiden i timmar för torrbatterier kan antas vara N(µA, a)-fördelad om de är av fabrikat A och N(µ 8 , a)-fördelad om de är av fabrikat B. Man bestämde driftstiden för 9 batterier av fabrikat A och fick XA = 182.4 och s~ = 159.0 samt för 16 batterier av fabrikat B och fick resultatet xB = 176.0 och s1J = 136.0. Bestäm ett symmetriskt konfidensintervall med konfidensgraden 98% för µA - µ 8 . Föreligger det skillnad i driftstiden? 8.27 Två lösningar av ett visst ämne har de okända koncentrationerna µ 1 , respektive µ 2 . På vardera lösningen gör man 5 bestämningar och får resultaten:
15.29 15.17
15.41 15.12
15.18 15.26
15.16 15.17
15.45 15.16
De erhållna mätvärden kan ses som två oberoende observerade stickprov x 1, x2, ... , X5 från N(µ 1 , a) och Y1, Y2, ... , y5 från N(µ2, a). Beräkna ett 95% konfidensintervall för µ 1 - µ 2 om a) det är känt att a = 0.1,
Räknehjälp:
I:;= 1 xi = 76.49, E:= xl = 1110.2121, 1
E:=1 Yi = 75.88, 8.28
b) a är okänt.
E:= 1 yf = 1151.5654.
Överhöjningen är ibland en kritisk kvalitetsegenskap hos monteringsfärdiga betongelement. Man ville undersöka om det var någon skillnad i detta avseende mellan element från två olika fabriker A och B. Man tog därför slumpmässigt ut 9 och 16 betongelement ur produktionen från fabrik A respektive B. Observationerna kan anses vara observerade stickprov från oberoende stokastiska variabler ~ och 1J som är N(µA, a) respektive N(µ 8 , a). Följande värden erhölls: A: B:
x = 18.1, y = 14.6,
s1 S2
= 5.0, = 7.1,
Undersök om det föreligger någon skillnad mellan fabrikerna genom att bestämma ett 99% konfidensintervall för µ 1 - µ 2 .
©
Studentlitteratur
8.4.
220 8.29
Konfidensintervall för u 2 och u i N(µ,u)
Man har mätvärden -3.4, 6.0,
3.0, 10,
2.0, 3.2,
från från
-4.8 -0.4,
Bestäm ett 98% konfidensintervall för µ 1 8.30
-
N(µ 1 , 2) N(µ 2 , 2.2).
µ2 .
Vid en undersökning av böjhållfasthetens beroende av bränntemperaturen hos gult tegel erhölls följande observationer. Temperatur 700° 800°
Xi
Yi
147 193
140 227
Böj hållfasthet 121 138 139 201 212 207
208
Antag att värdena vid 700° är ett observerat stickprov från N (µ 1 , a) och värdena vid 800° ett observerat stickprov från N(µ 2 , O") samt att stickproven är oberoende. Undersök om det finns skillnader i den genomsnittliga böjhållfastheten genom att bestämma ett 95% konfidensintervall för µ 1 - µ 2 . Hur stora är i så fall skillnaderna? 8.31
Man vill undersöka om två olika fotoelektriska densitometrar vid samma filmmaterial gav jämförbara värden på filmens optiska tjocklek. På samma filmremsa gjordes därför sju mätningar. Man fick följande resultat: Densitometer 1: Densitometer 2:
2.64 2.68
2.65 2.69
2.65 2.67
2.64 2.69
2.63 2. 70
2.63 2.68
2.62 2.66
Antag att mätvärdena kommer från två normalfördelningar med olika väntevärden men med samma standardavvikelse. Skatta skillnaden mellan väntevärdena med ett 99% konfidensintervall.
8.4
Konfidensintervall för a 2 och a i N (µ, a)
Antag att man skall mäta en fysikalisk storhet µ genom att göra n oberoende mätningar. Mätvärdena kan ses som utfall av oberoende stokastiska variabler ~ 1 , ~2, ... , ~n· Vi antar att mätmetoden är väntevärdesriktig och att mätfelen är normalfördelade, dvs ~i E N(µ, O"), i = 1, 2, ... , n. Då är det intressant att kunna uppskatta mätmetodens precision genom information om O" eller 0" 2 . Eftersom 0" 2 > 0 och a > 0, räcker det oftast att beräkna en uppskattning uppåt. Vi får då ett ensidigt, uppåt begränsat konfidensintervall för a 2 © Studentlitteratur
221
8. Intervallskattning
och u, dvs av typen [O, a]. Vi börjar med att försöka bestämma en uppåt begränsad intervallskattning av u 2 sedan får vi den för u med hjälp av kvadratrotsutdragning. Eftersom 0"2·
=
_1_
~ (~- _ ~)2
n-1L.t i=l
•
är den effektivaste punktskattningen av u 2 tycks det förnuftigt att bilda en intervallskattning utgående från u 20 . Man kan visa att den stokastiska variabeln
har en känd fördelning, som kallas x2-fördelning (utläses: tji-två fördelning) med n - 1 frihetsgrader. Vi skriver
0.2
Figur 8.9
x2 -fördelningen
Frekvensfunktionen för en
för några olika värden på frihetsgraderna /.
x2 ( n -1 )-fördelad stokastisk variabel är
där konstanten kn beror av n. Frekvensfunktionens utseende för några olika värden på frihetsgraderna framgår av figur 8.9. Vi ser att x2 -fördelningen är en sned fördelning. Den blir mindre sned då antalet frihetsgrader växer. ©
Studentlitteratur
222
8.4. Konfidensintervall för u 2 och u i N(µ, u)
x2-fördelningen finns tabellerad för olika värden på frihetsgraderna. Se appendix. För att bilda en intervallskattning av a- 2 visar det sig enklast att studera intervall av typen [O, k-a- 20 ], där kär en lämpligt vald konstant. Vi bestämmer k så att intervallet innehåller a- 2 med sannolikhet 1 - a. Det betyder att intervallet missar a- 2 med sannolikhet a, d v s P(k · a- 20 < a- 2 )
= a.
Genom att utnyttja att (n - l )a- 20 / a- 2 E x2 ( n - l) får vi
Denna sannolikhet är lika med a om (se figur 8.10)
n-l
-k-
2
= X1-o(n-l),
där betydelsen av xL 0 (n-l) framgår ur figur 8.10. Det innebär att vi har
k
n-l
= Xi-o 2 ( . n-l)
Figur 8.10 :l(n-1)-fördelningen.
Med sannolikhet 1 - a innehåller då intervallet
(;- l)a-2· ] = [o E~-1 (~i - ~)2]. [o, X1-o(n-l) ' xLo(n-1) parametern a- 2 . Detta intervall är alltså en uppåt begränsad intervallskattning av a- 2 med konfidensgrad 1 - a. © Studentlitteratur
8. Intervallskattning
223
Ett uppåt begränsat konfidensintervall för a 2 med konfidensgrad är då
[0
z:=;_1 (xi - x) 2] = [o '
xLo(n-1)
2]
(n - l)s 'XI-o(n-1) .
Genom kvadratrotsutdragning får vi att intervallet (n - l)s 2
xLo(n-1) är ett uppåt begränsat konfidensintervall föra med konfidensgrad 1 - a. Exempel 8.10 Vid 25 mätningar av tryckhållfastheten hos betong fick man x = 5.6 ksi och s 2 = 0.44 (ksi) 2 . (Enheten "ksi" betyder kilopounds per square inch.) Mätvärdena kan betraktas som ett observerat stickprov från en N(µ, a )-fördelning. Är det troligt att a 2 = 0.5? Besvara frågan genom att bestämma ett uppåt begränsat 99% konfidensintervall för a 2 . Lösning: Eftersom n = 25 och 1 - a = 0.99 så ger resonemanget ovan att det sökta konfidensintervallet är
[o, xt9:~:4J ·
Ur tabell fås
x~_
99 (24) = 10.9 och intervallet blir då · 0.44] [0, 2410 _9
= [O, 0.97].
Eftersom det 99% konfidensintervallet täcker över a 2 = 0.5 så kan det mycket väl tänkas att a 2 = 0.5. Vi har däremot inte bevisat att det måste vara så. Det kan lika gärna gälla att a 2 = 0.4 eller a 2 = 0.6. Däremot törs vi påstå med 99% säkerhet att a 2 inte kan vara 1.5 eftersom det 99% konfidensintervallet inte täcker 1.5. Ibland är man även intresserad av tvåsidiga intervallskattningar av a 2 , dvs av typen [k1 a 2 " , k 2a 2"], där k1 och k 2 är lämpligt valda konstanter. Om man väljer k1 och k2 så att det är lika stor sannolikhet att intervallet missar till höger som till vänster blir intervallet [
(n - l)s 2
(n - l)s 2
x!;2(n-l)' xL0;2(n-l)
l
ett konfidensintervall för a 2 med konfidensgrad 1 - a. Det visas med samma resonemang som tidigare. Ett tvåsidigt konfidensintervall för a med konfidensgraden 1 - a blir då
[
(n-l)s 2 x!;2(n- l)'
(n - l)s 2 xL0;2(n-l)
l
· © Studentlitteratur
8.4.
224
Konfidensintervall för u 2 och u i N(µ, u)
Exempel 8.11 Bestäm ett tvåsidigt 99% konfidensintervall för a 2 och a i exempel 8.10, där s = 0.44. Lösning: Det tvåsidiga 99% konfidensintervallet för a 2 blir
[
24s 2 24s2 ] X5.oos (24)' X5.995 (24) .
Ur tabell fås x5_ 005 (24) = 45.6 och x5_ 995 (24) = 9.89 och intervallet för a 2 blir alltså [ 24 · 0.44 24 · 0.44] 45.6 ' 9.89
= [0.23 1.07]. '
Ett 99% konfidensintervall för a blir således · 0.44 ✓24 · 0.44] = [0.48 1.04]. [ ✓2445.6 ' 9.89 ' Observera att konfidensintervallen för a 2 och a inte blir symmetriska kring s 2 respektive s. Men man brukar ändå kalla sådana konfidensintervall för symmetriska eftersom sannolikheten att missa parametern är lika stor till vänster som till höger.
Övningar 8.32
Spridningen på draghållfastheten hos ett visst material anses för stort, varför man överväger att ändra tillverkningsprocessen. För att undersöka spridningen då den nya processen används mätte man hållfastheten på 20 slumpmässigt valda enheter och fick följande mätvärden:
4
9
6
12
11
3
8
4
13 12
2 8
9 2
6 5
7 15
2 9
Dessa mätvärden kan anses vara ett observerat stickprov från en normalfördelning N(µ, a). Bestäm ett uppåt begränsat 99% konfidensintervall föra. Är det troligt att a = 6.5? Räknehjälp: 1 x = 147, 1 x 2 = 1373.
E:~
8.33
E:~
Vid en undersökning av spridningen hos mätresultaten från ett precisionsinstrument fick man värdena: 3.1
4.1
3.4
3.7
3.3
3.2
4.3
4.0
3.1
3.9.
Mätresultaten anses vara observationer från en normalfördelning med okända parametrar µ och a. Är det troligt att a = l. Besvara frågan genom att beräkna ett uppåt begränsat 99.9% konfidensintervall. © Studentlitteratur
8. Intervallskattning
225
8.34 Vid tillverkning av skruvar får variationerna hos huvudenas diameter inte vara för stora. Man har mätt diametern hos 50 skruvar och beräknats= 0.021 mm. Ge en övre begränsning för den sanna standardavvikelse 15/v'9 I~ E N(lOO, 15/v9)
)
..__,_,
=17EN{0,l)
Denna sannolikhet blir 0.05 om
k-100 15 / v'9
= .Xo.os = 1.64.
Härur fås k = 100 + 1.64 · 15/v9 = 108.2.
&
o.os
-
= ..
>-o.ol 1·'"
Vi får då följande beslutsstrategi, med vilken det bara är 5% risk att göra fel om det riktiga µ-värdet skulle vara 100. Om x > 108.2 så tror vi att 110 är det riktiga µ-värdet. Om
x~
108.2 så tror vi inte att ll0 är det riktigaµ- värdet.
Vad blir beslutet om vi använder denna strategi på de nio mätvärdena? Medelvärdet blir x = 108.9. Eftersom detta värde är större än 108.2 så förkastar vi µ-värdet 100 till förmån för µ-värdet 110. Med bara 5% risk att göra fel vågar vi alltså påstå att den nya metoden ger en genomsnittlig livslängd på ll0 timmar. (I verkligheten är påståendet att µ = 110 orealistiskt, istället bör det vara µ > 100. Men för att göra det enklare börjar vi så här och fortsätter i nästa avsnitt med den mer realistiska situationen.) I exempel 9.1 illustreras hur man resonerar vid statistisk hypotesprövning. Vid en sådan använder man sig av en speciell terminologi. Vi inför den genom att på nytt gå igenom exempel 9.1. ©
Studentlitteratur
9.1. Enkla hypoteser
234 100
tai.2 110 '
x hamnar här tror vi på slumpen och förkastar inte
x hamnar här förkastas H och vi 0 tror oå H1 : \J = 110
Om
Om
H
0
Figur 9.3
Vi antar att x 1 , x 2 , ... , Xn är observationer från en N(µ, 15)-fördelning, där µ är antingen 100 eller 110. Vi sätter upp en nollhypotes Ho:µ = 100 och en mathypotes H 1 :µ = 110. Vi prövar (eller testar) nollhypotesen Ho mot mothypotesen H 1 med hjälp av testvariabeln x. Beslutsstrategin (eller testet) är följande (se figur 9.3). Om x > 108.2 så förkastas Ho och H1 anses styrkt. Om x '.S 108.2 så kan Ho inte förkastas och vi kan inte anse oss ha styrkt något. Detta test har en felrisk på 5% om Ho är sann. Denna felrisk kallas för testets signifikansnivå och betecknas med a, dvs
a = P( förkasta Ho I Ho sann). I exempel 9.1 gäller att siginifikansnivån är
a=
P( ~ > 108.2 I~ E N(lOO, 15/v'9)) = 0.05.
Att denna sannolikhet blir 0.05 vet vi eftersom vi bestämde den kritiska gränsen k = 108.2 för att just det skulle gälla. När man med statistisk hypotesprövning vill visa något, som i exempel 9.1 att µ ökat till 110, så gör man alltså på följande sätt. Man sätter upp en nollhypotes Ho som svarar mot det som allmänt anses som det sanna förhållandet (Ho:µ = 100). Sedan sätter man upp en mothypotes H1 som svarar mot det man själv anser vara det sanna förhållandet (H1 : µ = 110). Det innebär att i mothypotesen sätter man det man vill försöka visa. Man bildar sedan en lämplig testvariabel och en strategi, baserad på testvariabeln, så att testets signifikansnivå blir låg, tex 5% eller 1%. Man kan då lätt bemöta en motståndare som tror på nollhypotesen. För om nollhypotesen skulle vara sann så har man ju mycket liten sannolikhet att förkasta den genom en slump. Man har gett motståndaren stor chans att få rätt om han skulle ha rätt. © Studentlitteratur
9.
235
Hypotesprövning
Ett test bör ha liten felrisk om Ho är sann, dvs låg signifikansnivå. Ett test bör även ha stor chans att upptäcka att H 1 är sann, när så är fallet. Sannolikheten att förkasta Ho när H 1 är sann bör alltså vara stor för att testet skall vara bra. Denna sannolikhet, dvs P(förkasta Ho I H 1 sann), kallas testets styrka.
Exempel 9.2 Beräkna styrkan för testet i exempel 9.1. Lösning: Vi förkastar Ho:µ= 100 då x > 108.2. Eftersom x är ett observerat värde på där~ E N(ll0, 15/J§) om H 1 : µ = 110 är sann, fås testets styrka
t
P( förkasta Ho I H1 sann)
P( ~ > 108.2 I~ E N(ll0, 15/J§)) = l _ (108.2 - 110) = 15/J§ 1 - ( -0.36) = (0.36)
~
0.64
Signifikansnivån a och styrkan för testet i exempel 9.1 är åskådliggjorda i figur 9.4.
108.2.
100
uo
Figur 9.4
Man vill naturligtvis använda test som har både låg signifikansnivå och hög styrka. Signifikansnivån bestämmer man genom att välja det kritiska värdet k lämpligt. Om man sedan finner att det framräknade testet har för låg styrka så kan man antingen välja ny testvariabel eller skaffa sig fler observationsvärden (se övning 9.3). Om man har två testvariabler, exempelvis x och medianen md, så kan man alltid välja områden att förkasta Ho, så att båda testen har samma signifikansnivå. För att sedan välja ut det "bästa" testet kan man beräkna styrkan och använda det test vars styrka är högst. ©
Studentlitteratur
9.1.
236
Enkla hypoteser
Övningar 9.1
En tillverkare A av brytpinnar påstår att brytpinnarnas genomsnittliga livslängd är 200 timmar. En konkurrent B tvivlar starkt på detta påstående och hävdar att den genomsnittliga livslängden är 190 timmar. Man låter en opartisk testanstalt mäta livslängden hos 15 slumpmässigt utvalda brytpinnar från A:s tillverkning. De 15 mätningarna gav resultatet x = 194.8. a) Tillverkaren A vill använda resultatet till att försöka visa att hans påstående är riktigt. Ställ upp nollhypotes och mothypotes och genomför detta test på 1% signifikansnivå under förutsättning att livslängden är normalfördelad med standardavvikelse 10 timmar. b) Beräkna styrkan hos testet i a). c) Konkurrenten B vill använda detta resultat för att försöka visa att hans påstående är riktigt. Ställ upp nollhypotes och mothypotes och genomför testet på 1% signifikansnivå under förutsättning att livslängden är normalfördelad med standardavvikelse 10 timmar. d) Beräkna styrkan hos testet i c).
9.2
Vad blir slutsatsen i övning 9.1 a) och c) om man hade fått följande resultat x = 196.8?
9.3
I exempel 9.1, sid 231 testar man hypotesen Ho : µ = 100 mot hypotesen H1 : µ = 110 då man har 9 observationer från en N(µ, 15)fördelning. Med 5% signifikansnivå fick man testet: förkasta Ho om x 2:: 108.2. Detta test har styrkan 0.64 (se exempel 9.2, sid 235). Man anser att detta test har för låg styrka. För att få ett test med högre styrka måste man basera det på fler observationer. a) Hur många observationer behövs för att man skall få ett test som har 5% signifikansnivå och styrkan minst 95%? (Observera att man får ett nytt förkastelseområde.) b) Bestäm det nya testet.
9.4
©
Försökspersoners reaktionstider i sekunder vid ett visst psykologiskt test kan antas vara normalfördelade med väntevärde µ och standardavvikelse er = 2. Man vill testa Ho : µ = 25 mot H 1 : µ = 23 på signifikansnivån 0.01. Hur många observationer behövs om man vill att styrkan skall vara minst 0.98 ? Bestäm också testet.
Studentlitteratur
237
9. Hypotesprövning
9.2
Sammansatta mothypoteser, tillämpningar på normalfördelningen
I exempel 9.1 hade vi hypoteser som innehöll ett enda värde påµ. Sådana hypoteser kallas enkla hypoteser. I de flesta fall är det orealistiskt att sätta upp enkla mothypoteser. I exempel 9.1 är det förmodligen troligare att gruppen vill visa att den genomsnittliga livslängden har ökat, dvs att µ > 100, med den nya metoden. Det innebär att man ska använda mothypotesen H 1 : µ > 100. En sådan hypotes kallas sammansatt. Vi ska nu studera test för några olika sammansatta mothypoteser.
9.2.1
Test avµ, då a är känt
Exempel 9.3 Vi går tillbaka till problemställningen i exempel 9.1. Det utvecklingsgruppen vill visa är att µ > 100. Vi antar då att livslängden kan betraktas som en N(µ, 15)-fördelad stokastisk variabel, där µ 2'. 100, och att x 1, x2, ... , x 9 är observationer från denna fördelning. Det vi (dvs utvecklingsgruppen) vill visa är attµ måste vara större än 100. Vi skall då testa H 0 : µ = 100 mot H 1 : µ > 100. Även här verkar det intuitivt riktigt att säga att vi förkastar Ho om x blir alltför mycket större än 100. Vi använder alltså följande strategi.
Om x > k så förkastas Ho. Om x :=:; k så förkastas inte Ho. Konstanten k (som är större än 100) bestäms sedan så att testets signifikansnivå a blir låg, tex a = 0.05. Då får vi samma test som i exempel 9.1 eftersom Ho är densamma som där. Det betyder att den kritiska gränsen blir k = 108.2. Vi förkastar alltså Ho om x > 108.2. Om x :=:; 108.2 förkastas inte Ho
100
.
fsmspsssmmmsmi Fi!BB 108.2 ''
Om x hamnar här så tror vi ~tt µ > 100 och förkastar H0 • Figur 9.5
Från exempel 9.1, sid 231, ser vi att x = 108.9. Vi förkastar alltså Ho på 5% signifikansnivå till förmån för H1. Med 5% risk att göra fel kan vi alltså påstå att µ är större än 100. ©
Studentlitteratur
238
9.2. Sammansatta mathypoteser vid normalfördelning
Förändringen av mothypotes från H 1 : µ = 110 till H1 : µ > 100 förändrar alltså inte själva testet. Skillnaden ser vi först när vi skall beräkna testets styrka. På sid 235 definierades testets styrka som förkasta Ho givet H1 sann. I exempel 9.3 innehåller H 1 emellertid alla µ > 100. För vart och ett av dessa µ-värden kan vi beräkna ett värde på styrkan. Styrkan blir nu alltså en funktion av µ, definierad för µ > 100. Denna funktion S av µ, definierad som
S(µ)
= =
P( Förkasta Ho när det sanna värdet är µ) = P( Förkasta Ho I µ ),
kallas testets styrkefunktion. Styrkefunktionen beräknar man alltså för alla värden på µ som ingår i mothypotesen. Oftast är vissa värden i mothypotesen speciellt intressanta så att man vill få hög styrka i dessa µ-värden. På samma sätt som vid enkla hypoteser så kan man öka testets styrka genom att öka antalet observationer. Exempel 9.4 Beräkna styrkefunktionen för testet i exempel 9.3 i punkterna µ = 105, 110, 115. Observera att dessa tre µ-värden tillhör mothypotesen H1: µ > 100. Lösning: Testet i exempel 9.3 är: förkasta Ho om x > 108.2 och det har 5% signifikansnivå. Om µ = 105 så är x en observation på ~ E N(105, 15/v9). Styrkefunktionen i punktenµ= 105 blir då S(l05)
P( Förkasta Ho
Iµ
= 105) =
Pa > 108.2 I µ = 105) = P( ~ - 105 > 108.2 - 105 I
----15/v9
15/v9
=l µ
05
)
=
=77EN(O,l)
l _ 'P (108.2 - 105) = 15/v9 1 - 'P(0.64) = 1 - 0.74 = 0.26. På motsvarande sätt fås styrkefunktionen iµ= 110:
S(110)
P( Förkasta Ho / µ = 110) = P( ~
> 108.2 / µ = 110) = ~ 110 > 108.2 - 110 / _
P( -
15/v9
-----
15/v9
=77EN(O,l)
1- 'P (108.2 - 110) = 15/v9 1 - 'P( -0.36) = 'P(0.36) ©
Studentlitteratur
) _
µ - 110 -
= 0.64.
9. Hypotesprövning
239
Styrkefunktionen iµ= 115:
S(115)
= =
P( Förkasta Ho I µ = 115) = P( ~ > 108.2 I µ = 115) =
P( ~ - 115
15/v'9 ..__,__.,
> 108.2 - 115 I = l ) =
15/v'9
15
µ
=T)EN(0,1)
1- cp (108.2 -115) =
15/v'9
1 - IP(-1.36) = cp(l.36) = 0.91.
Om vi beräknar styrkefunktion i exempel 9.4 i ytterligare några punkter så kan vi sedan skissera kurvan y = S(µ). Dess utseende framgår av figur 9.7.
o.t
,oo Figur 9.6 Styrkefunktion i exempel 9.4.
Av styrkefunktionens utseende framgår att ju längre från nollhypotesen det sanna µ-värdet ligger desto större är sannolikheten att förkasta H 0 . Detta är ju en rimlig egenskap hos ett bra test. Observera också att styrkefunktionen i µ = 100, dvs S(lOO) är lika med testets signifikansnivå. Vi skall nu betrakta ytterligare några hypotesprövningssituationer som kan uppkomma när man testar sammansatta mothypoteser av µ i normalfördelning. Exempel 9.5 En industri behöver en typ av provstavar som måste tåla en viss belastning. Om N = antal belastningscykler före utmattnings brott så påstår tillverkaren att vid påkänningen 65 ksi (ksi = kilopounds per square inch) så är lg N i genomsnitt 5.20. Detta tycker köparen låter som ett alltför stort värde på lg N och misstänker att det kan vara mindre. Köparen bestämmer sig för att i första omgången köpa 25 stavar och undersöka hur mycket de tål. Man mäter antalet belastningscykler N ©
Studentlitteratur
240
9.2.
Sammansatta mathypoteser vid normalfördelning
som de inköpta stavarna tål för den givna påkänningen. Man anser sig kunna anta att lg N varierar enligt en normalfördelning med väntevärde µ och med spridning r, = 0.20. Om x1, x2, ... , X25 betecknar de mätvärden man får på lg N så blev resultatet x = 5.13. Är detta ett "troligt" värde att få när µ = 5.20, som tillverkaren påstår, eller betyder utfallet att det sanna µ-värdet är mindre än 5.20? Kan verkligen slumpen ge resultatet x = 5.13 när µ =5.20? För att kunna försvara sig mot tillverkaren om man finner att stavarna tål mindre belastning än vad tillverkaren uppgivit så vill man besvara frågan med ett lämpligt test med signifikansnivån 1%. Lösning: Mätvärdena x 1 , x2, ... , x2 5 kan antas vara observationer från en N(µ, 0.2)-fördelning. Vi skall bestämma ett lämpligt test på 1% signifikansnivå för att testa
Ho : µ = 5.20 mot
H1 : µ < 5.20.
Eftersom x är en "bra" skattning av µ använder vi x som test variabel. Om Ho är sann så bör x hamna i närheten av 5.20 medan om H 1 är sann så bör x bli betydligt mindre än 5.20. Det innebär att om x blir alltför mycket mindre än 5.20 bör vi förkasta H0 . Vad som är "alltför mycket mindre" beror då på signifikansnivån, som är 1%. Vi beslutar alltså: om x < k så förkastas H0 , om x 2: k så förkastas inte Ho, där det kritiska värdet k (som är mindre än 5.20) bestäms så att testets signifikansnivå blir 1%. (Se figur 9.8.)
N(s.20,0.2./\/2!)
,7
... ----=--v-------k
5.20
Om x hamnar här så förkastas H . 0
Figur 9.7
Vi genomför nu motsvarande resonemang som i exempel 9.3, sid 237, för att bestämma det kritiska värdet k. Omµ= 5.20 så är ju x ©
Studentlitteratur
9. Hypotesprövning
241
en observation på~ E N(5.20,0.2/v'25) och signifikansnivån är
pa < k Iµ= 5.20) = ~ - 5.20 k- 5.20 I =5W ) = P( - - - < - - 0.2/v'25 0.2/v'25 µ . .
P(Förkasta Ho Iµ= 5.20) =
.._,_, =77EN(O,l)
Denna sannolikhet blir 0.01 om k - 5·20 0.2/v'25
= -2.3263 '
varav k = 5.20 - 2.3263 · 0.2 ~ = 5.107.
v25
Vi förkastar Ho på 1% signifikansnivå om x < 5.107. Se figur 9.8. Eftersom resultatet av mätningarna blev x = 5.13 så kan Ho inte förkastas på 1% signifikansnivå. Det innebär att vi på 1% signifikansnivå inte kan påstå att stavarna tål mindre än den angivna belastningen. Men vi har med detta ändå inte visat att µ = 5.20. Det enda vi kan påstå är att det inte finns tillräckligt belägg för attµ < 5.20.
N(s.20, 0.2/i/i!,)
;; S'.101
... - - v - - - - - - - '
s.20
Om x hamnar här så förkastas H0 : µ = 5.20
Figur 9.8
Exempel 9.6 Betrakta testet i 9.5 sid 239. Vad är sannolikheten att förkasta Ho om µ = 5.00, dvs vad är testets styrka i punkten µ = 5.00? Lösning: Omµ= 5.00 så är x en observation på~ E N(5.00, 0.2/ v'25) ©
Studentlitteratur
9.2. Sammansatta mothypoteser vid normalfördelning
242
och vi kan beräkna testets styrka i punktenµ= 5.00. Den blir S(5.00)
P( Förkasta Ho I µ = 5.00) = P(~ < 5.107 Iµ= 5.00) = P ( ~ - 5.oo < 5.107 - 5.oo 0.2/v25 4'> ( 5 · 107 - 5 ·00 ) 0.2/v25
0.2/v25
= 5 _00 ) =
1
µ
= 4'>(2.675) = 0.996.
Det är alltså mycket stor sannolikhet att testet skall "upptäcka" att Ho inte är sann om det riktiga µ-värdet är 5.00. Exempel 9.7
Vid tillverkning av sinter för framställning av järn är det viktigt att järnmalmen håller en järnhalt på omkring 63.0%. Om järnhalten blir alltför mycket lägre eller alltför mycket högre måste man ändra tillsatsen av kalksten, annars blir inte sintern tillräckligt hållbar. För att kontrollera att den genomsnittliga järnhalten håller sig på 63.0% så tar man regelbundet prover på järnmalmen innan den går in i sinterverket. Vid varje provtagningstillfälle tas 5 prover. Man vet av erfarenhet att järnhalten kan antas vara normalfördelad med väntevärde µ% och standardavvikelse 1%, där µ håller sig kring 63.0. Efter varje provtagningstillfälle vill man testa Ho : µ = 63.0 mot H1 : µ f:. 63.0. Om Ho förkastas så justeras kalkstensintaget därefter. Eftersom man inte vill justera i onödan har man bestämt att testets signifikansnivå skall vara 5% Bestäm ett lämpligt test. Lösning: Mätvärden x1,X2, ... ,x5 (i enheten %) kan antas vara observationer från en N(µ, 1)-fördelning. För att testa H0 : µ = 63.0 mot H1: µ f:. 63.0 använder vi som tidigare testvariabeln x. Om Ho är sann så bör x hamna i närheten av 63.0 medan x kan bli antingen större eller mindre än 63.0 om H1 är sann. Det innebär att Ho bör förkastas om x är alltför mycket mindre eller alltför mycket större än 63.0. Ett rimligt test är då följande (se figur 9.9):
x < k1 eller x > k2 så förkastas Ho, om k1 s; x s; k2 så förkastas inte Ho. om
Konstanterna k1 (som är mindre än 63.0) och k 2 (som är större än 63.0) bestäms så att testet får signifikansnivån 5% ..Om Ho är sann, dvsµ= 63.0, så är x en observation på~ E N(63.0, 1/v'S). Vi skall alltså bestämma k1 och k2 så att vi har sannolikhetsmassan 0.05 utanför intervallet [k1, k2] och får då arean 0.025 i varje "svans". ©
Studentlitteratur
9. Hypotesprövning
243
kt.
63.0
... ------v--'~
Om x ha11N1ar här förkastas H0
Om x hamnar här forkastas H0
Figur 9.9
Vi får då
P( C < k1 's
I
µ
= 63.0) =
p(
~-
63.0 1/Js
k , 2
= 63.o) = p (
µ
~-
63.o > k2 - 63.o , = 63.o) 1/Js 1/Js µ
blir 0.025 om
k2 - 63.0 1/Js
= 1. 96 ,
dvsom
k2 = 63.0 + 1.96 · 1/V5 = 63.88. Ett lämpligt test på 5% signifikansnivå är alltså: Om i< 62.12 eller i> 63.88 så förkastas Ho. Om 62.12::; i::; 63.88 förkastas inte H 0 .
I exempel 9.7, där mothypotesen är H 1 :µ =/- 63.0, säger man att man har en tvåsidig testsituation. Om mothypotesen är H 1 : µ < 63.0 så kallar man det för en ensidig testsituation. ©
Studentlitteratur
244
9.2.2
9.2. Sammansatta mothypoteser vid normalfördelning
Test av µ då a är okänt
Låt x 1 , x 2 , ... , Xn vara observationer från en N(µ, a)-fördelning. Om a är känt kan vi använda x som testvariabel för att testa Ho : µ = µ 0 mot exempelvis Ho : µ > µ 0 . När vi bestämmer testet så utnyttjar vi att x är en observation på~ där fördelningen för~ är fullständigt känd om Ho är sann. Vi skall nu betrakta test av Ho : µ = µ 0 mot någon mothypotes H1 nära är okänd. Då kan vi inte längre använda x som testvariabel, ty fördelningen för~ innehåller den okända parametern a, dvs är inte fullständigt känd, då Ho är sann. Det innebär att vi inte kan beräkna något område där Ho skall förkastas. Men vi kan ändå använda ett test där x ingår i testvariabeln om vi skattar a 2 med s 2 = n~l I:;~ 1 (xi - x) 2 och använder
som testvariabel. Om Ho är sann, dvsµ= µ 0 , så vet vi att tär en observation på ~ -µo I ~ E t(n -1), a* yn
där a*
=
Eftersom t är en observation från en fördelning som är fullständigt känd då Ho är sann, så kan vi beräkna ett område där Ho skall förkastas.
Exempel 9.8 Man vill avgöra om en metalltråd är gjord av ren koppar eller ej genom att undersöka trådens resistans. Teoretiska beräkningar ger att trådens resistans är 55 mil om den är gjord av ren koppar. Om mätapparaturen vet man att den ger ett mätresultat som kan betraktas som N(µ, a)-fördelat, där µ är den sanna resistansen och a är mätfelets (okända) standardavvikelse. Man gör 12 mätningar av trådens resistans och får resultatet:
53.7 52.3
56.1 51.1
55.2 55.2
55.1 54.1
51.9 53.5
57.2 50.8
Testa hypotesen att tråden är gjord av ren koppar IJ}.Ot att den inte är gjord av ren koppar på 5% signifikansnivå. Lösning: De tolv mätvärdena x1, X2, ... , x 12 är observationer från en N(µ, a)-fördelning, där a är okänd. Vi skall testa Ho : µ = 55 © Studentlitteratur
9. Hypotesprövning
245
mot H1 : µ =I- 55. Eftersom a är okänd kan vi inte använda x som testvariabel utan väljer i stället
x-55
(9.2)
t=--
s/vU som testvariabel, där
Om Ho är sann så bör x hamna i närheten av 55, dvs t bör hamna i närheten av 0. Medan om H 1 är sann så kan x antingen bli mycket större än 55 eller mycket mindre än 55, dvs t kan bli mycket större eller mycket mindre än 0. Ett lämpligt test blir då följande: Om t
< k1 eller t > k2 så förkastas Ho.
Om k1 :S t :S k2 så förkastas inte Ho. Konstanterna k1 (som är mindre än 0) och k2 (som är större än 0) bestäms sedan så att testet får 5% signifikansnivå. (Se figur 9.10.)
__!ci Om •t hamnar här så förkastas H0 .
Om
h.nä·r
här så förkastas H0 . Figur 9.10
Eftersom testvariabeln t i (9.2) är en observation på ~ - 55
a*/
vU E t(n - 1) om µ = 55
får vi 0.025 = P (
~ - 55 ) vU < k1 I µ = 55 , a• / 12
...__.., Et(ll)
©
Studentlitteratur
Sammansatta mothypoteser vid normalfördelning
9.2.
246
vilket ger (se figur nedan) k1 = -to.025(11) = -2.20.
På motsvarande sätt fås
0.025 =
P( a•~ /-~> k2 Iµ= 55), 12
-------Et(ll)
vilket ger
-to.oasClt)
k2 = to.025(11) = 2.20. Testet blir alltså:
förkasta Ho om t < -2.20 eller t > 2.20, förkasta inte Ho om -2.20 Här är x = 53.85 och
s2
t
: 5400 och det är mycket troligt att µ = 6300. För att visa påståendet tänker man mäta livslängden hos n däck och sedan testa Ho : µ = 5400 mot H 1 : µ > 5400. Bestäm n och testet så att signifikansnivå blir 0.01 och testets styrka i µ = 6300 blir minst 0.95. 9. 7
En tillverkare av syntetiskt gummi påstår att hans gummi håller en medelhårdhet på 64 Shore-grader. Man anar att detta påstående kan vara antingen en underskattning eller en överskattning. För att undersöka denna misstanke gör man 10 prov på hårdheten och får x = 65.0. Kan man på 5% signifikansnivå påstå att tillverkaren har fel? a) Sätt upp nollhypotes och mothypotes och genomför testet under förutsättning att hårdheten är normalfördelad med standardavvikelse CJ = 2. b) Bestäm testets styrka i punkterna 61 och 66.
9.8
En viss typ av provstavar måste tåla en viss belastning. Man mätte lg N för 25 inköpta provstavar, där N = antal belastningscykler före utmattningsbrott vid påkänningen 65 ksi. Man kan anta att lg N varierar enligt en N(µ, 0.2)-fördelning. Tillverkaren påstår att µ = 5.20. Om x 1 , x2, ... , X25 betecknar mätvärdena man fick på lg N så blev resultatet x = 5.13. I exempel 9.5, sid 239, testades Ho : µ = 5.20 mot H 1 : µ < 5.20 på 1% signifikansnivå. Man fann då att Ho kan inte förkastas på 1% signifikansnivå, dvs man kunde på 1% nivån inte påstå att stavarna tål mindre än det angivna värdet. Vad blir resultatet om man genomför testet på 10% signifikansnivå?
9.9
Vid tillverkning av sinter för framställning av järn är det viktigt att järnmalmen håller en järnhalt på omkring 63%. Man tar regelbundet prover på järnmalmen innan den går in i sinterverket. Av erfarenhet vet man att järnhalten kan antas vara N(µ, 1)-fördelad. Efter varje provtagningstillfälle testas Ho : µ = 63 mot H 1 : µ =I- 63. Om Ho förkastas så justeras processen. I exempel 9. 7, sid 242, visades att om man tar 5 prover vid varje provtagningstillfälle så får man följande test på 5% signifikansnivå: förkasta Ho om x < 62.12 eller x > 63.88. Efter en tids användning av testet tycker man att de_t fungerar dåligt. Det händer alltför många gånger att Ho inte förkastats då så borde ha skett. Man har alltför ofta fått sinter av dålig kvalitet. Man misstänker att testet har för låg styrka. a) Vad är sannolikheten att justera processen (dvs förkasta Ho) om µ = 62?
©
Studentlitteratur
9.
Hypotesprövning
249
b) Hur många prover måste man ta vid varje provtagningstillfälle för att få ett test med 5% signifikansnivå och styrkan minst 0.90 då µ = 62?
9.10
Vid kontroll av ett parti stenkol uppmättes askhalten i 12 olika prover till i genomsnitt x = 8.6%. Mätvärdena vid detta mätförfarande på denna kolsort kan betraktas som observationer på en N (µ, 1)fördelning. Leverantören har garanterat att den genomsnittliga askhalten skall vara högst 8% i partiet. Kan man påstå att leverantören har fel? Besvara frågan genom att formulera lämpliga hypoteser och bestämma ett lämpligt test på signifikansnivån a) 0.1%,
9.11
b) 5%.
En forskare har bildat en ny legering och teoretiskt beräknat dess smältpunkt till 1050°. För att kontrollera resultatet har man med en väntevärdesriktig metod mätt smältpunkten hos 10 prover av legeringen och erhållit följande mätvärden. 1054.8 1047.9
1052.9 1051.8
1051.0 1048.5
1049.8 1050.2
1051.6 1050.7
Variationerna i mätvärdena beror på brister hos termometern. Erfarenhet från tidigare försök ger att man kan anta att mätfelen är oberoende och normalfördelade med standardavvikelse a = 2.3. a) Testa hypotesen att smältpunkten är 1050° på nivå 5%. Som mothypotes tas att smältpunkten är skild från 1050°. b) Bestäm testets styrkefunktion och beräkna styrkan för alternativen µ = 1051 °ochµ= 1053°. c) Diskutera vilka slutsatser som kan, resp inte kan dras av testet. 9.12
Ett stålverk producerar en speciell stållegering med en genomsnittlig sträckgränsµ= 180 N/mm. En ändring i sammansättningen av legeringen påstås öka sträckgränsen. Sträckgränsen kan betraktas som en normalfördelad stokastisk variabel med känd standardavvikelse a = 2 N/mm 2 . Ändringen i sammansättningen bör inte påverka standardavvikelsen. Man gör 19 mätningar av sträckgränsen med den nya legeringen och får x = 182 N/mm 2 . Kan man på 1% signifikansnivå påstå att den genomsnittliga sträckgränsen har ökat? a) Besvara frågan genom att testa en lämplig nollhypotes mot en lämplig mothypotes. Det skall klart framgå vilka hypoteserna är. ©
Studentlitteratur
9.2.
250
Sammansatta mathypoteser vid normalfördelning
b) Om den sanna sträckgränsen ärµ= 181 N/mm 2 , hur stor är sannolikheten att förkasta nollhypotesen om man använder testet i a)? 9.13
Den dagligen upplösta syrekoncentrationen vid en plats A strax nedanför ett industriutsläpp har mätts under 10 dagar med följande resultat: 1.8
2.0
2.1
1.7
1.2
2.3
2.5
2.9
1.6
2.2
(enhet: mg/I). Mätvärdena kan antas komma från en N(µ, 0.4)fördelning. Kan man påstå att den genomsnittliga dagligen upplösta syrekoncentrationen µ är större än 1. 75 om man är villig att ta en felrisk på 0.1% omµ= 1.75? a) Besvara frågan med hjälp av statistisk hypotesprövning. b) Skissera styrkefunktionen för testet i a). 9.14 Ett företag tillverkar en stålsort A med genomsnittlig draghållfasthet µ = 48.0 kp/mm 2 . Man har tagit fram en ny stålsort B för vilken man gjort dragprov på 20 provkroppar.
a) Antag att man inte vill ersätta A med B om det inte är klart att B är bättre än A (dvs har större genomsnittlig draghållfasthet). Formulera lämplig nollhypotes och mothypotes samt bestäm ett lämpligt test för att testa om A skall ersättas med B om man kan anta att draghållfastheten är normalfördelad. b) Utför testet i a) på 10% signifikansnivå om de 20 proven gav x = 48.3 och s = 1.5. c) Utför testet i a) på 0.05% signifikansnivå om de 20 proven gav x = 49.7 och s = 1.7. 9.15
En tillverkare A av glödlampor hävdar i sin reklam, att lampornas genomsnittliga livslängd är större än 200 timmar vid användning under normala betingelser. Konkurrenten B tvivlar på detta påstående och hävdar att den genomsnittliga livslängden är mindre än 200 timmar. Vid en opartisk testanstalt mäts livslängden (enhet: tim) hos 10 dylika lampor, vilket ger följande resultat: 198 214
213 201
207 199
197 209
192 212
a) Tillverkaren A vill använda detta material för att försöka visa att hans påstående är riktigt. Sätt upp nollhypotes och mothypotes och genomför testet på 5% signifikansnivå under förutsättning att livslängden är normalfördelad. ©
Studentlitteratur
9. Hypotesprövning
251
b) Konkurrenten B vill använda detta material för att försöka visa att hans påstående är riktigt. Sätt upp nollhypotes och mothypotes och genomför testet på 5% signifikansnivå under förutsättning att livslängden är normalfördelad.
9.16 En viss mas_kin används för precisionstillverkning av enheter som bör väga 785 gram. Man misstänker en viss dag systematiska avvikelser i produktionen så att enheterna blir för lätta. För att kontrollera detta tar man ut ett slumpmässigt stickprov om 8 enheter ur denna dagsproduktion. Resultatet blev (i gram): 780 _S
783 -1..
781 -4
785l)
783 -"l
786I
784 -I
781 . _,.
Formulera lämplig nollhypotes och mothypotes för att kontrollera om misstanken stämmer. Genomför testet på 5% signifikansnivå under förutsättning att mätvärdena är normalfördelade.
9.17 I ett laboratorium har man gjort 6 mätningar för att bestämma halten µ av ett visst ämne i en råvara. Halten skall helst vara 5.5 men man misstänker att den kan vara skild från detta värde. Mätvärdena kan antas vara normalfördelade. a) Sätt upp lämplig nollhypotes och mothypotes och bestäm ett lämpligt test på 10% signifikansnivå. b) Genomför testet då resultatet blev x = 5.575 och s = 0.201. c) Genomför testet då resultatet blev x = 5.675 och s = 0.195.
9.3
Samband mellan konfidensintervall och hypotesprövning vid normalidrdelning
Eftersom konfidensintervall och test bygger på liknande stokastiska variabler i normalfördelningssituationen verkar det troligt att det finns ett samband. Låt oss jämföra fallen att bilda ett symmetriskt konfidensintervall för µ med konfidensgrad 1- a, då /J' är känt, och att testa Ho : µ = µ 0 mot H1 : µ =/- µ 0 på signifikansnivå a, då /J' är känt. Vid hypotesprövningen fås testet på signifikansnivån a: förkasta Ho om
x > µ 0 + Ao/20' / fo
förkasta inte Ho om µ 0
-
eller
Ao/20' / fo ~
x < µo -
Ao/20' / fo,
x ~ µo + Ao/20' / fo. ©
Studentlitteratur
9.3.
252
Samband mellan konfidensintervall och hypotesprövning. - -
Detta kan skrivas om som:
x - >.a.;2a / ,/n eller µo > x + >.a.;2a / Jn, om x - >.a.;2a / ,/n ~ µo ~ x + >.a.;2a / Jn.
förkasta Ho om µ0 < förkasta inte Ho
Testet säger alltså: förkasta inte Ho på signifikansnivå a om intervallet
täcker µ 0 . Men detta intervall är ju det symmetriska, tvåsidiga konfidensintervallet för µ med konfidensgraden 1 - a. Alltså gäller att om det tvåsidiga konfidensintervallet för µ med konfidensgrad 1 - a täcker µ 0 så förkastas inte H 0 : µ = µ 0 vid test mot H 1 : µ -/- µ 0 på signifikansnivån a. Om intervallet inte innehåller µ 0 så förkastas alltså Ho: µ = µ 0 vid test mot H1: µ-/- µo på signifikansnivån a. Om man testar ensidiga mothypoteser så finns det liknande samband med ensidiga konfidensintervall. Betrakta exempelvis test av Ho : µ = µo mot H 1 : µ > µ 0 på signifikansnivå a, då a är känt. Då förkastas Ho om x > µ 0 + >.a.a / ,/n och förkastas inte om x ~ µ 0 + >.a.a / ,jn. Detta kan skrivas om som: förkasta Ho om µ 0 < x - >.a.a / ,/n, förkasta inte Ho om µ 0 2: x - >.a.a / ,/n. Om intervallet [x - >.a.a / ,/n, oo[ täcker µ 0 så skall Ho inte förkastas på signifikansnivån a. Detta intervall är ett nedåt begränsat, ensidigt konfidensintervall förµ med konfidensgrad 1- a. Det ser vi med hjälp av följande resonemang.
Om det nedåt begränsade ensidiga konfidensintervallet för µ med konfidensgrad 1 - a täcker µ0 så förkastas alltså inte Ho : µ = µ 0 mot H1 : µ > µ 0 på signifikansnivå a. Och om det nedåt begränsade ensidiga konfidensintervallet inte innehåller µ0 så förkastas alltså Ho : µ = µ 0 mot H1 : µ > µ 0 på signifikansnivå a. Om man har en testsituation och tänker dra slutsatser med hjälp av motsvarande konfidensintervall så är det mycket viktigt att man använder rätt typ av konfidensintervall. I annat fall kan slutsatserna bli helt felaktiga för en given signifikansnivå. Observera att sambanden vi tagit fram mellan test och konfidensintervall endast gäller vid normalfördelning. I många situationer kan man härleda bra test men det finns inga motsvarande bra konfidensintervall. Ofta är det lättare att formulera sitt problem som ett © Studentlitteratur
9.
253
Hypotesprövning
hypotesprövningsproblem än som ett skattningsproblem. Dessutom bör man alltid ha kontroll över testets styrka vilket man inte har om man bildar ett konfidensintervall. I gengäld så gäller att om man kan förkasta Ho genom att använda konfidensintervallmetoden så har man direkt en uppskattning på, exempelvis hur långt ifrån µ 0 det riktiga µ-värdet ligger. I många sammanhang bör man_först göra en hypotesprövning, där man har testets styrka under kontroll, och sedan följa upp med en intervallskattning.
Övningar 9.18
Härled sambandet mellan test och konfidensintervall om man i en normalfördelningssituation med fJ känt testar
9.19
I exempel 9.3, sid 237, testas Ho:µ= 100 mot H1 : µ > 100 utgående från 9 observationer från en N(µ, 15)-fördelning. a) Bestäm det konfidensintervall som bör användas om man vill genomföra testet på 5% signifikansnivå med hjälp av konfidensintervallet. Man fick x = 108.9. b) Genomför testet med hjälp av resultatet i a).
9.20
I 9.5, sid 239, testas Ho : µ = 5.2 mot H1 : µ < 5.2 utgående från 25 observationer från en N(µ, 0.2)-fördelning. a) Bestäm det konfidensintervall som bör användas om man vill genomföra testet på 1% signifikansnivå med hjälp av konfidensintervallet. Man fick x = 5.13. b) Genomför testet med hjälp av resultatet i a).
9.21
I exempel 9.7, sid 242, testas Ho : µ = 63 mot H1 : µ -1- 63 utgående från 5 observationer från en N(µ, 1)-fördelning. Bestäm det konfidensintervall som bör användas om man vill genomföra testet på 5% signifikansnivå med hjälp av konfidensintervallet.
©
Studentlitteratur
254
9.4. Sammansatta mathypoteser vid binomialfördelning
9.4
Sammansatta mot hypoteser, tillämpningar på binomialfördelning
Innan vi går in på test i binomialfördelningssituationen skall vi ta upp den sk direktmetoden för att avgöra om en nollhypotes skall förkastas. Säg att vi kommit fram till att Ho skall förkastas för stora värden på testvariabeln. (Se figur 9.11.) Istället för att bestämma värdet på gränsen k kan man undersöka om testvariabelns värde har hamnat i förkastelseområdet på följande sätt. Man räknar ut sannolikheten att, om Ho är sann, få ett lika extremt eller extremare värde på testvariabeln än det man just observerat. Kalla denna sannolikhet o:o. I det fall som o: 0 förkastas för stora värden på testvariabeln är "lika extremt eller extremare värde" detsamma som "lika stort eller större värde". Allmänt gäller att vad som är lika extremt eller ännu extremare värde bestäms av mothypotesens utseende. Sedan man har beräknat o: 0 så jämför man o:o med signifikansnivån o: med följande resultat. (Se figur 9.11.) Om ao < a så måste man ha hamnat "så långt ut i svansen" att Ho skall förkastas Om ao > a så har man inte hamnat i förkastelseområdet och förkastar inte Ho.
Om a 0 < a har vi hamnat här och måste förkasta H
0
k' - - - - - . , - - - ... Här förkastas H
0
area ot.
Om a 0 > a har vi hamnat här och kan inte förkasta H0
;
a.rea.ot.
~
k
···--y----'
Här f"drkastas inte H
0
Figur 9.11 Testvariabelns fördelning om Ho är sann.
I många sammanhang används beteckningen p eller P istället för 00 och o:o-~rdet kallas därför också för P-värde. Vi använder beteckningen 00 för att mte det ska förväxlas med p i binomialfördelningen här. © Studentlitteratur
9. Hypotesprövning
255
Direktmetoden är användbar om man inte skall beräkna styrkefunktionen eller om man testar hypoteser i diskreta fördelningar. Vi skall nu med några exempel se hur man kan testa hypoteser om parametern p i binomialfördelningen.
Exempel 9.10 Kalixkillen Kalle och Töretösen Tora singlar slant. Kalle vinner om krona kommer upp medan Tora vinner om klave kommer upp. Kalle tycker att Tora vinner misstänkt många gånger. Han tror att myntet är osymmetriskt på så vis att sannolikheten för krona är mindre än 0.5. För att försöka visa detta låter han Tora singla slanten 17 gånger. I 5 av de 17 kasten blev det krona. Kan Kalle, om han är villig att ta 10% felrisk om myntet skulle vara symmetriskt, påstå att sannolikheten för krona är mindre än 0.5? Lösning: Låt p beteckna sannolikheten för krona. Vi skall alltså testa Ho : p = 0.5 mot H 1 : p < 0.5 på 10% signifikansnivå. En lämplig testvariabel är x = antalet krona vid de 17 kasten. Om Ho är sann bör x hamna i närheten av 8 eller 9. Medan om H1 är sann så bör x bli betydligt mindre. Det innebär att Ho bör förkastas om x < k, där k < 8. Istället för att bestämma k så skall vi använda direktmetoden. Eftersom x är en observation på~' där~ E Bin(l7,p) kan vi enkelt räkna ut sannolikheten för ett lika extremt eller extremare utfall. Eftersom det blev 5 krona och Ho förkastas om antalet krona är alltför litet så skall vi beräkna sannolikheten att få ett så litet värde som 5 eller ännu mindre om Ho är sann. Vi får då
a 0 = P(~::; 5 I~
E Bin(17,0.5))
= 0.07173:::::: 0.072
Denna sannolikhet a 0 = 0.072 skall sedan jämföras med signifikansnivån a = 0.10. Eftersom a 0 = 0.072 < 0.10 = a, så blir slutsatsen att Ho förkastas på 10% signifikansnivå. Med 10% felrisk kan alltså Kalle påstå att sannolikheten för krona är mindre än 0.5. Om mothypotesen är tvåsidig, tex H 1 : p =/= 0.5, så skall man komma ihåg att "dela upp" signifikansnivån a, i båda "svansarna" av fördelningen. Om man använder direktmetoden så kan man då räkna på utfallet i den ena "svansen" och jämföra den uträknade sannolikheten med a/2.
Exempel 9.11 Antag att Kalle och Tora i exempel 9.10, sid 255, hade bestämt sig innan de började spela att testa om myntet är osymmetriskt, dvs testa Ho : p = 0.5 mot H 1 : p =I= 0.5, på 10% signifikansnivå. Vad blir då resultatet av testet om 5 av 17 kast gav krona? Lösning: Vi låter, som i exempel 9.10, x = antal krona vid de 17 kasten vara testvariabel. Eftersom mothypotesen är H1 : p =/= 0.5 så ©
Studentlitteratur
9.4.
256
Sammansatta mothypoteser vid binomialfördelning
skall Ho förkastas om x blir alltför litet eller alltför stort. Vi använder nu direktmetoden. Eftersom vi fick x = 5 och alltså hamnat i "den vänstra svansen" beräknar vi P( ~:::; 5 I Ho sann). Denna sannolikhet skall sedan jämföras med o:/2 = 0.10/2 = 0.05. I exempel 9.10 fick vi
P(~:::; 5 I Ho sann= 0.072). Eftersom 0.072 > o:/2 = 0.05 så blir slutsatsen att Ho inte kan förkastas på 10% signifikansnivå. Om man har en observation från en binomialfördelning där n är stort kan naturligtvis Poisson- eller normalapproximationerna (se sid 87 och sid 172) användas för att beräkna sannolikheterna i hypotesprövningen. Exempel 9.12 En firma påstår att felkvoten i ett parti enheter är högst 0.03. En köpare misstänker att felkvoten är större. För att kontrollera detta väljer man slumpmässigt ut 100 enheter och finner att 7 är defekta. Kan köparen, med 5% felrisk, påstå att firman har fel?
Om p får beteckna felkvoten i partiet skall vi testa Ho : > 0.03. Som testvariabel använder vi x = antalet defekta enheter bland de 100 utvalda. Ho förkastas om x är alltför stort. Om Ho är sann är x en observation på t där~ E Bin(lO0, 0.03). Men eftersom n är stort och p är litet (n > 10, p < 0.l) kan vi approximera binomialfördelningen med en Poissonfördelning med >. = 100 · 0.03 = 3. Vi använder direktmetoden och får Lösning:
p = 0.03 mot H1 : p
o:o = P(lika extremt eller extremare utfall än
= P( ~ ;:::: 7 I ~ :=:::J
E Bin(lO0, 0.03))
71 Ho
sann) =
:::::J
P( 1J ;:::: 7 I ~ E Po(3)) =
= 1-
P( 1J :::; 6 I ~ E Po(3)) =
= 1 - 0.96649 :::::J 0.034. Eftersom o:o = 0.034 < 0.05 = o: så kan Ho förkastas på 5% signifikansnivå. Med 5% felrisk kan då köparen påstå att firman har fel.
Övningar 9.22
Sannolikheten att ett visst slumpmässigt försök lyckas är p. Vid en serie av 11 oberoende upprepningar lyckas 9 försök. Testa, med hjälp av direktmetoden, på 5% signifikansnivå Ho : p = 0.5 mot a) H1 : p > 0.5,
© Studentlitteratur
b) H 1 : p =/- 0.5.
9.
257
Hypotesprövning
9.23 Vid tillverkning av fjäderbrickor misstänker man att sannolikheten, p, för att en tillverkad bricka skall vara defekt har ökat. Enligt tidigare undersökningar bör man ha p = 0.01. För att testa hypotesen Ho : p = 0.01 mot hypotesen H 1 : p > O.Ol tar man ett slumpmässigt stickprov omfattande 300 brickor ur ett mycket stort antal tillverkade brickor. Man finner 8 defekta brickor. Genomför testet på 2% signifikansnivå. 9.24 Vid en frekvensstudie observerade man en maskin vid 250 på måfå valda tidpunkter. Vid 60 av dessa stod maskinen stilla. Låt p vara sannolikheten att maskinen står stilla vid en på måfå vald tidpunkt. Testa Ho: p = 0.2 mot H 1 : p > 0.2 på 1% signifikansnivå. 9.25
Pitepilten Pelle skall undersöka om ett mynt tenderar att ge färre krona än klave. Om p är sannolikheten att få krona så vill han testa Ho : p = 0.5 mot H 1 : p < 0.5. Han tänker kasta myntet 18 gånger och förkasta Ho om antalet krona är mindre än 6. a) Bestäm testets signifikansnivå. b) Bestäm testets styrka i p = 0.25.
9.26 Ljusblixtar som levereras till ett laboratorium uppges ha sannolikheten p = 0.02 att inte fungera. För att testa detta mot alternativet att felsannolikheten är större än som uppgivits provar man 60 blixtar. Om antalet felaktiga är 4 eller flera så förkastas nollhypotesen att sannolikheten för fel är p = 0.02. a) Bestäm testets signifikansnivå. b) Bestäm testets styrka i p = 0.1. 9.27 En firma tillverkar mätapparatur till vilken behövs elektroniska kretskort. Det blir dyrt om man får in för många defekta kretskort i produktionen. Man har därför en bötesklausul inskriven i köpekontraktet. Den träder i kraft om sändningen innehåller mer än 1% defekta kretskort, dvs om felkvoten är större än 0.01. För att kontrollera om bötesklausulen behöver utnyttjas har man en mottagningskontroll. Kretskorten ligger i förpackningar med 10 000 i varje. Man tar 200 kort på måfå ur varje förpackning och kontrollerar dem. I en sändning på 80 förpackningar fick man följande resultat. a) Bestäm en observerad skattning av felkvoten i sändningen. b) Bör bötesklausulen träda i kraft? Besvara frågan med ett lämpligt test på 0.1 % signifikansnivå. (I och med denna övning har vi svarat på frågorna i exempel 1.1, sid 2.) ©
Studentlitteratur
9.5.
258
Teckentest
Tabell 9.1 Antal defekta kretskort bland 200 utvalda i 80 förpackningar
1 4 1
3 5 2 5 2
2 1 2 5 1 1 2 4
1 1 2 1
0 0
3 3 2 3
3 2 4 2
2 2
3 0 2 2 1 1 1
0
3 1 2 4 1 1
3 3
4 1 2
0 3 4 3 1
2
4
0
0
5 1 2
2 4 1 1
3 0 1
0 1
7 4 2 1 4 3 1 1
9.28 För en viss mätapparatur misstänker man att mätfelen inte enbart är slumpmässiga utan även systematiska. För att undersöka detta mäter man 9 gånger en storhet vars värde man känner exakt. Låt x 1 , x 2 , •.• , x 9 beteckna mätfelen vid dessa 9 mätningar. Erfarenhetsmässigt kan man anta att x 1 , x2, •.. , Xg är observationer från en normalfördelning N(A, 0.4). Nu misstänker man att A > 0 och inte 0. Därför skall man testa Ho : A = 0 mot H1 : A > 0 och väljer mellan två test. Det ena testet är det vanliga baserat på x. Det andra testet är baserat på d, där där antalet positiva x-värden.
a) Bestäm de två testen så att båda får signifikansnivån 0.09. b) Beräkna styrkan i A = 0.34 för de båda testen i a). c) Vilket av de två testen bör man välja? Motivera svaret.
9.5
Teckentest
Många gånger kan man inte göra något antagande vilken fördelning som observationerna kommer ifrån. Om man i en sådan situation vill jämföra exempelvis två behandlingar för att försöka visa att den ena är att föredra, så måste man använda en sk icke-parametrisk metod. Vi skall här behandla en sådan, som kallas teckentest. Teckentestet används om man har en situation med stickprov i par, men inte kan göra något normalfördelningsantagande. Det beskrivs enklast med ett exempel. Exempel 9.13 En tillverkare av stålrör vill undersöka om en viss ytbehandling har någon korrosionsminskande effekt. Man har grävt ner 15 behandlade och 15 obehandlade rör parvis, så att ett behandlat och ett obehandlat rör befinner sig i varje par. De båda rören i ett par befinner sig då i samma miljö medan olika par kan befinna sig i helt olika miljöer. © Studentlitteratur
9. Hypotesprövning
259
Efter en tid gräver man upp rören och ser efter i hur många par som det behandlade röret rostat mest. Man fann 3 par där det behandlade röret rostat mest. (Vi förutsätter att man alltid kan se någon skillnad.) Kan man på 5% signifikansnivå påstå att ett behandlat rör i genomsnitt korroderar mindre än ett obehandlat? Lösning: · Vi skall testa
Ho : rören korroderar i genomsnitt lika mycket mot H1 : ett behandlat rör korroderar i genomsnitt mindre än ett obehandlat.
Låt x vara antalet par bland de 15 där det behandlade röret rostat mest. Den enda information vi har är att x = 3. Då använder vi x som testvariabel. Om Ho är sann bör x hamna i närheten av 7 eller 8. Medan x bör bli litet om H 1 är sann. Vi förkastar alltså Ho om x < k. Nu använder vi direktmetoden för att undersöka om det är troligt att få ett så litet värde som 3 eller ännu mindre om Ho är sann. Då måste vi först bestämma vilken fördelningen x är observation från. Men om Ho är sann är det ju lika stor sannolikhet att ett behandlat rör korroderar mer än ett obehandlat som att det korroderar mindre. Det innebär att om Ho är sann så är x en observation på ~, där ~ E Bin(l5, 0.5). Vi kan alltså beräkna P( ~ : ··r ·
.cc-
f i • CC
:::1:-:--1.+: 1.,-:,-,,,~ .... ,.i.=i- , -cc: , c• 7;-J"C'E'
,-;-±-.....1:l!
+.-4==--
r-::.
-l••""'-
g i=l
©
Studentlitteratur
288 där Zi där observerat värde på (i. Det andra testet är baserat på d, där där observerat värde på antalet skillnader (i, som är större än 0. a) Formulera en lämplig nollhypotes och en lämplig mothypotes för situationen. Bestäm sedan de två testen så att båda får signifikansnivå 0.09. b) Man vill använda det test som har den största sannolikheten att ge ett riktigt beslut om ~ = 0.34. Vilket av de två föreslagna testen bör man använda? 11.13 Från vardera av två fabrikanters produktion av betongelement togs ett slumpmässigt stickprov. Man mätte längden av dessa uttagna betongelement och fick följande resultat i cm:
Fabrikat 1: Fabrikat 2:
20.3 19.8 19.9 20.1
20.7 20.1 19.7 20.3.
19.9.
Observationerna av fabrikat 1 antas komma från N(µ 1 , o-) medan de av fabrikat 2 antas komma från N (µ 2 , o-). Alla parametrarna är okända. Bilda ett 95% konfidensintervall för µ 1 - µ 2 . 11.14 En viss typ av benbrott har i en svensk normalgrupp en årlig frekvens av 257 på 100000 personer. I en grupp på 623 epileptiker förekom ett år 5 sådana benbrott. Testa med lämpligt test på 1% signifikansnivå om frekvensen hos epileptiker är signifikant högre än hos befolkningen i övrigt. 11.15 En tillverkare av trästegar, som tidigare använt lufttorkat trä till stegarnas sidstycken, har från en större trävarufirma fått ett erbjudande att istället köpa ugnstorkat virke. Detta skulle visserligen bli väsentligt billigare, men det ugnstorkade virket har lägre hållfasthet än det lufttorkade. Efter noggrant övervägande bestämmer sig stegfabrikanten för att övergå till ugnstorkat virke, om det vid försök visar sig att skillnaden i hållfasthet signifikant understiger 10 kp / cm 2 . De därefter utförda proven gav följande resultat (hållfasthet i kp/cm 2 ):
Lufttorkat trä (x):
107.9 105.0
103.2 103.6
106.3 103.3
106.0 104.6
101.6 102.1
Ugnstorkat trä (y):
94.5 98.3
99.2 92.9
94.0 97.6
95.8
96.4
Observationerna kan anses vara oberoende och och komma från normalfördelningar med väntevärde µ 1 resp µ 2 (båda okända) samt samma (okända) standardavvikelse o-. ©
Studentlitteratur
289
11. Blandade övningar
a) Konstruera ett test som testar
Ho: µ 1 - µ 2 = 10 mot H1: µ 1 - µ 2 < 10 på 5% signifikansnivå. b) GenÖmför testet. 11.16 I samband med processtyrning av en tillverkningsprocess brukar man ta ut och mäta fem enheter med jämna tidsmellanrum och sedan i ett sk styrdiagram pricka in medelvärdet av de fem mätvärdena. Så länge det inprickade värdet håller sig mellan styrgränserna anses processen vara under kontroll, men när en punkt hamnar utanför gränserna. tas det som ett tecken på att "någonting hänt".
a) Om de fem mätvärdena x 1 , x2, ... , x 5 kan anses vara observationer från N(µ, a) medµ och a känt, från vilken fördelning är då
1
x=-I:> • 5
5 .
en observation? b) Om (vilket är vanligt) styrgränserna är µ
+~
och µ -
~
hur
stor är sannolikheten för "falskt alarm" , d v s sannolikheten för att x hamnar utanför gränserna då x är observation av den i a) bestämda fördelningen. c) Bestäm k så att sannolikheten för "falskt alarm" med kontrollka ka . gränsernaµ- J5 ochµ+ J5 bhr 0.05. d) Anta nu att väntevärdet µ genom en feljustering plötsligt ändras till µ + a. Hur stor är sannolikheten att detta omedelbart upptäcks genom det första inprickade medelvärdet x efter feljusterinka ka gen hamnar utanför gränserna µ - J5 och µ + J5? 11.17 Låt s 2 vara stickprovsvariansen för ett stickprov av storleken 25 på en stokastisk variabel, som är N(µ, a)-fördelad. För att testa Ho: a 2 = 1 mot H 1 : a 2 < 1 används s 2 som testvariabel. Ho förkastas om s 2 < k, där kväljs så att testet får signifikansnivån 0.05. Bestäm k. 11.18 Antag att ~1 och ~2 är oberoende observationer från en exponentialfördelning med den okända parametern Å (dvs väntevärdet~ (1) =
min(~1,~2)©
Studentlitteratur
290 a) Bestäm P(~(l) > x) , (dvs sannolikheten att både ~1 och ~2 är större än x) och med hjälp därav frekvensfunktionen för ~(l). b) Bestäm (tex med hjälp av resultatet av a) konstanten c så att µ* = ~(1) blir en väntevärdesriktig punktskattning av väntevärdet µ. 11.19 I nedanstående sk spelträd markerar Al, A2, Bl, B2, B3 och B4 en beslutsfattares möjliga drag. I varje grenände markeras vinsten V (enhet:kr).
40
Vilka drag väljer beslutsfattaren om han a) vill maximera sin förväntade vinst? b) med största sannolikhet vill vinna minst 100 kr? 11.20 Fångvaktarens dilemma: Tre fångar A, B och C får av sin fångvaktare reda på att en av dem på måfå har utvalts för att avrättas och de två andra skall friges. Fånge A, som är bevandrad i sannolikhetslärans djungler, inser att sannolikheten för att just han avrättas är 1/3. Fånge Aber fångvaktaren att i förtroende för honom nämna en av de två andra (B eller C) som skall friges under förevändningen att detta inte skulle lämna honom någon väsentlig information, eftersom han vet att åtminstone en av de två andra skall friges. Fångvaktaren vägrar dock av etisk-moraliska skäl att gå med på detta, då han anser att sannolikheten för att A avrättas då skulle stiga till 1/2, eftersom A skulle vara en av två fångar, av vilka en skall avrättas. Visa att sannolikheten för att A avrättas fortfarande är 1/3 även om fångvaktaren skulle gå med på A:s begäran. I händelse av att A skall avrättas antas fångvaktaren lika gärna säga 'B friges" som "C friges". 11.21 I ett gatunät, där kvarteren är kvadrater, är A och B motsatta hörn i en kvadrat, som bildas av fyra kvarter. En person startar från A till B samtidigt som en annan person startar från B till A, varvid de går med © Studentlitteratur
11.
Blandade övningar
291
samma konstanta hastighet. I ett gatuhörn väljer de alltid en sådan riktning, att de inte avlägsnar sig från målet. Om det finns två sådana riktningar, sker valet mellan dessa på måfå, så att sannolikheten för vardera riktningen är 0.5 . Sök sannolikheten för att de två personerna möts. 11.22 Vid dåvarande Tekniska Högskolan i Luleå pågick ett projekt där man studerade underbenssvullnaden hos personer med stillasittande arbete. Man hade konstruerat en apparat för noggrann mätning av underbenens volym. Med denna mätte man volymsökningen under dagen av underbenen hos 6 personer dels under normala arbetsdagar, dels under dagar där personerna fick röra sig var 15:e minut, sk omväxlingsdagar. Man fick följande värden på volymsökningen (i%) Försökspersonen normaldag (xi) omväxlingsdag (yi)
1
2
3.7 2.0
4.1 2.1
3 5.5 2.7
4 3.9 1.8
5 3.4 2.9
6 5.3 2.6
a) Kan man med någon grad av säkerhet påstå att det är skillnad på genomsnittlig volymsökningen vid normaldagar och omväxlingsdagar? Hur stor är i så fall skillnaden? Besvara frågorna genom att bilda ett symmetriskt 99% konfidensintervall för den systematiska förväntade skillnaden ~ och sedan utgående från detta dra slutsatserna. Observationsvärdena kan antas normalfördelade så att Xi är ett observerat värde från en N(µi, a-i)-fördelning och Yi är ett observerat värde från en N(µi + ~, a- 2 )-fördelning. b) Visa att konfidensintervallet som används i a) har den angivna konfidensgraden eller härled intervallet utgående från en lämplig fördelning. 11.23 Antag att man i föregående övning 11.22 inte kan förutsätta att mätvärdena kommer från en normalfördelning. För att då testa Ho: ingen genomsnittlig skillnad på volymsökningen mot H1: genomsnittlig skillnad föreligger måste man göra ett icke-parametriskt test. a) Testa på lämpligt sätt Ho mot H 1 i utgående från mätvärdena i övning 11.22. Använd 1% signifikansnivå. b) Hur många försökspersoner måste minst användas för att man överhuvudtaget skall kunna besluta att Ho skall förkastas på 1% signifikansnivå om man använder testet i a)? 11.24 En viktig del av sannolikhetsläran i olika tekniska sammanhang (inte minst transportteknik) är köteorin. Som en enkel illustration på det ©
Studentlitteratur
292 antar vi att vi har ett transportband på vilket enheter anländer till en förpackningsstation. Tiderna mellan ankommande enheter antas vara oberoende och Exp(>.). Vidare antar vi att den tid det tar att ta hand om en enhet är Exp(µ). Om det då bara finns en person vid förpackningsstationen måste >.. och µ anpassas så att personen hålls jämt sysselsatt. Man kan visa att efter lång tid är P(~ = k) = (1 - p) pk, k O, l, . . . om ~ är antalet enheter vid stationen och konstanten = 1/ >.. =
p
l/ µ
E (tid mellan ankomster) < 1. E(tid för förpackning)
Bestäm hur väntevärdet för tiden mellan ankommande enheter måste vara för att sannolikheten att personen är sysslolös ska bli högst 0.05 omµ= 0.1. 11.25 Vid en tillverkning av en viss typ av pappersark är den önskade tjockleken 0.06 mm. Om den genomsnittliga tjockleken hos papperet överskrider eller underskrider detta värde måste maskinen justeras. För att kontrollera detta tas med jämna mellanrum ut 25 ark vars tjocklek mäts. På basis av dessa mätvärden x 1 , x2, ... , x25 skall man sedan besluta om maskinerna skall justeras eller ej. Man vill inte justera i onödan eftersom varje justering ger ett visst produktionsbortfall. Man har bestämt att onödig justering får ske i högst 5% av fallen. Av erfarenhet vet man att pappersarkens tjocklek kan betraktas som normalfördelad med väntevärde µ och standardavvikelse 0.003 mm.
a) När skall man besluta att maskinen skall justeras? Lös problemet genom att bestämma testet av Ho: µ = 0.06 mot H 1 : µ -/= 0.06 på 5% signifikansnivå. Det skall klart framgå när de olika besluten tas. Vad blir beslutet om x = 0.061? b) Vad blir sannolikheten att förkasta Ho om µ = 0.059? 11.26 Ett mått som brukar användas i samband med underhåll för maskiner är tillgängligheten (eller asymptotiska tillgängligheten)
A
=
E(~) E(~) + E(r,)
där ~ är tiden till fel för maskinen och 17 är reparationstiden. Man kan visa att A approximativt anger sannolikheten för att maskinen vid en slumpmässigt vald tidpunkt är i funktion. För en viss maskintyp är ~ exponentialfördelad med >.. = 0.01. Hur stort får väntevärdet för reparationstiden högst vara om A 2'. 0.95? © Studentlitteratur
11. Blandade övningar
293
11.27 En tillverkningsprocess är sådan att om en tillverkad enhet är korrekt är nästa enhet defekt med sannolikhet 0.1 och om en enhet är defekt är nästa enhet korrekt med sannolikhet 0.8. Om i en följd av tillverkade enheter nr 1 är korrekt, vad är sannolikheten att a) enhet nr 3 är korrekt?
b) enhet nr 4 är korrekt?
11.28 Vid en undersökning skall man bestämma brottgränsen hos betong för 16 slumpmässigt utvalda provstycken. Resultatet skall redovisas i form av ett tvåsidigt konfidensintervall för "medianbrottgränsen". Konfidensgraden skall vara minst 99% . Konstruera en intervallskattning som uppfyller dessa krav samt beräkna det konfidensintervall som fås då mätresultaten blev (enhet: kilopounds per square inch) 5.6 7.1
5.3 4.7
4.0 5.5
4.4 5.9
5.5 6.4
5.7 5.8
6.0 6.7
5.6 5.0
Mätvärdena kan inte antas vara normalfördelade utan det enda antagande som kan göras är att fördelningen för brottgränsen är kontinuerlig. 11.29 Antag att mätvärdena i övning 11.28 kommer från en N(µ, 0.75)-fördelning. Bestäm under dessa nya förutsättningar det i övning 11.28 efterfrågade 99% konfidensintervallet. 11.30 Med hjälp av ett slumpmässigt stickprov om 10 värden på~ E N(µ 1 , a) erhöll Kalle följande 95% konfidensintervall för µ 1 : [16.42, 18.28]. På liknande sätt erhöll Tora med ett slumpmässigt stickprov om 12 värden på 77 E N(µ 2 ,a) följande 95% konfidensintervall för µ 2 : [15.13, 16.78]. Hjälp Kickan att konstruera ett 95% konfidensintervall för µ 1 - µ 2 med användning av Kalles och Toras resultat. Standardavvikelsen a är okänd. 11.31 Den tid (enhet: minut) som behövs för att betjäna en kund som anländer till ett lager kan betraktas som en summa av tre stokastiska variabler som är oberoende och exponentialfördelade med väntevärden 2, 3 respektive 6. Låt~ vara den sammanlagda tid det tar att betjäna 100 kunder vilkas expeditionstider är oberoende. Beräkna med lämplig approximation det tal a som är sådant att P(~ ::; a)
= 0.90. ©
Studentlitteratur
294
11.32 En kedja är inte starkare än sin svagaste länk". Påfrestningen (enhet: kN) som en länk tål antar vi vara en stokastisk variabel som är Rayleighfördelad med frekvensfunktionen
f(x)= {
lxe-x2/8
0,
'
x>0 fö;ö;rigt.
a) Vad är sannolikheten att en kedja som består av 4 länkar brister om den utsätts för belastningen 500 N = 0.5 kN? b) Man utsätter 5 kedjor av ovanstående typ för belastningen 0.5 kN. Vad är sannolikheten att exakt 3 kedjor brister? Händelser att olika länkar brister antas vara oberoende. 11.33 En TV-tillverkare köper kondensatorer i partier om 10 000 stycken från en underleverantör. Genomslagsspänningen hos en kondensator i ett parti kan betraktas som en stokastisk variabel som är N(µ, 50)fördelad. TV-tillverkaren kan inte godta kondensatorer därµ är mindre än 500 V. Underleverantören garanterar attµ är minst 500 V. TVtillverkaren misstänker att underleverantören har fel och undersöker därför 100 kondensatorer ur varje parti och mäter genomslagsspänningen. För ett parti blev genomsnittsvärdet för de 100 kondensatorerna x = 490. Kan TV-tillverkaren underkänna partiet om han är villig att ta en risk på 5% att göra fel?
a) Besvara frågan genom att testa en lämplig nollhypotes mot en lämplig mothypotes. Det skall klart framgå vilka hypoteserna är. b) Hur stor sannolikhet har man att, med det i a) använda testet, underkänna ett parti medµ= 485? 11.34 I en tygaffär står expediterna Tora, Kalle och Pelle. De har olika åsikter om hur man lämpligast mäter upp 2 meter tyg med ett 1/2metersmått. Tora mäter upp 4 st 1/2-meterslängder efter varandra. Kalle mäter upp 2 st 1/2-meterslängder efter varandra. Sedan tar han denna längd och viker över resten av tygrullen. På så sätt avsätter han en exakt lika lång tygbit till. Pelle mäter upp 1 st 1/2-meterslängd. Sedan tar han denna längd och viker över resten av rullen 3 gånger. På så sätt avsätter han 3 exakt lika långa tygbitar till. Man kan betrakta varje mätning med 1/2-metersmåttet som en stokastisk variabel med väntevärde 0.5 och standardavvikelse 0.01. Olika mätningar kan antas vara oberoende för alla tre expediterna. Vilken metod är lämpligast i den meningen att standardavvikelsen för den uppmätta "2-metersbiten" (vars förväntade längd är 2 meter) är minst? © Studentlitteratur
295
11. Blandade övningar
Ledning: Toras metod ger en sammanlagd längd som kan ses som summan av fyra (olika) oberoende och likafördelade stokastiska variabler. Enligt Kalles metod blir längden 2 gånger summan av två (olika) oberoende och likafördelade stokastiska variabler. Pelles metod ger en längd som kan betraktas som 4 gånger en stokastisk variabel. 11.35 För att en pumpstation skall fungera fordras att komponent A fungerar samt att minst en av komponenterna B och C fungerar.
A, B och C har funktionssannolikheter 0.99, 0.90 respektive 0.80 och fungerar oberoende av varandra. a) Bestäm sannolikheten för att stationen fungerar. b) Vad blir funktionssannolikheten om vi parallellkopplar en pump D med B och C om D har funktionssannolikhet 0.80? 11.36 Ett bostadsområde om 1000 hushåll planeras. Sannolikheten för att ett hushåll har inget, ett, två eller tre barn under skolåldern kan antas vara 0.50, 0.30, 0.15 respektive 0.05. Hur många daghemsplatser skall planeras om sannolikheten för att alla barn skall kunna få daghemsplats skall vara 90% ? 11.37 För 10 patienter, som ingår i en undersökning, har man gjort arbetsprovsmätningar före respektive efter en period av fysisk träning. Man har därvid bestämt W 110, som är en väldefinierad fysiologisk variabel. Resultatet av arbetsprovet blev:
8 9 10 7 6 4 5 2 3 Patient nr 1 1000 900 750 Före (xi) 550 750 1100 950 950 900 650 Efter (Yi) 620 790 1050 960 975 920 710 1010 870 780 Man anser sig kunna anta att observationsvärdena är normalfördelade, så att xi är ett observerat värde från en N(µi,0-1)-fördelning och Yi är ett observerat värde från en N(µi + ~, 0-2)-fördelning. Beräkna under dessa antaganden ett 95% konfidensintervall för ~11.38 Resultaten av åtta olika laborationsgruppers bestämning av den universella gravitationskonstanten G med hjälp av en torsionspendel fram©
Studentlitteratur
296 går av följande tabell (enhet 10- 11 Nm 2 /kg 2 ): 1 2 6.67 6.62
3 6.71
4 6.68
5 6 7 6.69 6.67 6.64
8 6.70
Mätvärdena kan anses komma från en normalfördelning med väntevärde G och okänd standardavvikelse. a) Beräkna ett symmetriskt konfidensintervall för G med konfidensgraden 95%. b) Vad menas med att ett konfidensintervall som det i a) har 95% konfidensgrad? 11.39 Man vill bestämma svavelhalten i ett parti brännolja. Det går till så, att man tar ut fyra prover av oljan och analyserar varje prov två gånger, varpå man tar aritmetiska medelvärdet av de åtta analysvärdena. Felen vid provtagningarna är (i någon enhet) N(0,0.1) och analysfelen är N(O, 0.2) och alla dessa fel är oberoende. Vad är sannolikheten för att absolutbeloppet av felet i slutresultatet blir högst 0.1? 11.40 Vid en viss högskola finns en kurs i tillämpad matematik som består av fyra delkurser. För att erhålla betyget godkänd på en delkurs behövs minst 19.5 poäng på antingen en tenta eller en omtentamen. En student har vid varje tentamenstillfälle en poängsumma som kan antas vara N(20, 5)-fördelad. Studenten skriver alla fyra tentorna och där så behövs en (och endast en) omtentamen per delkurs. Beräkna sannolikheten att studenten
a) missar såväl tentan som omtentamen på en delkurs. b) blir godkänd på hela kursen i tillämpad matematik (dvs godkänd på samtliga delkurser). Avdelningen överväger att ändra system för att godkänna en delkurs på följande sätt. Förutom om man har minst 19.5 poäng på antingen en tenta eller en omtentamen erhåller man betyget godkänd på en delkurs om man har minst 16.5 poäng på både tentan och omtentamen på kursen. Vad blir då sannolikheten att studenten c) missar såväl tentan som omtentamen på en delkurs? d) blir godkänd på hela kursen i tillämpad matematik? (Oberoende får förutsättas där så behövs. Tentor och omtentor förutsätts lika svåra.)
©
Studentlitteratur
11. Blandade övningar
297
11.41 En vägningsmetod är sådan att mätfelet har väntevärdet 0 och variansen a 2 . Man väger med denna metod dels var och en av två guldklimpar och dels båda guldklimparna tillsammans. Låt dessa mätvärden vara ~1 , ~ 2 och ~3 .
a) Visa att för varje a, 0 :::; a :::; 1, gäller att
om µ 1 och µ 2 är de båda guldklimparnas verkliga vikter. b) Bestäm a så att V (a(~ 1 + ~2 ) + (1 - a)~ 3 ) blir minimal om de tre mätfelen är oberoende. 11.42 I en tillverkningsprocess med felsannolikheten p undersöker man tillverkade enheter, tills man får en defekt enhet. Låt ~ vara antalet undersökta enheter, när man för första gången får en defekt enhet, denna enhet medräknad. Antag även att felen förekommer oberoende av varandra. Bestäm sannolikhetsfördelningen för ~. 11.43 Låt A, B och C vara tre händelser sådana att P(A) = 0.2, P(B) = 0.5 och P(C) = 0.1.
a) Visa att 0.5 :::; P(A u Bu C) :::; 0.8. b) Antag nu speciellt att A, B och C är oberoende. Hur stor blir i så fall P(A u Bu C)? 11.44 Den dagligen upplösta syrekoncentrationen vid en plats A strax nedanför ett industriutsläpp har mätts under 10 dagar med följande resultat (enhet: mg/I)
1.8
2.0
2.1
1.7 1.2
2.3
2.5
2.9
1.6
2.2
Antag att mätvärdena kommer från en N(µ, 0.4)-fördelning. Härled ett symmetriskt 99% konfidensintervall för µ. 11.45 Visa att för godtyckliga händelser A1, A2, ... , An gäller
Denna olikhet kallas Booles olikhet. 11.46 Låt A och B vara oberoende händelser. Visa att ©
Studentlitteratur
298 a) Ac och B är oberoende händelser, b) Ac och Be är oberoende händelser. 11.47 Till en fabrik har inkommit två stora kemikaliepartier. Man har tagit n 1 prover från det första och n 2 från det andra och bestämt halten av ett visst ämne i proverna. Mätvärdena x 1 , X2, ... , Xn, är observationer på~ som är N(µ 1 , a) och y1 , y2 , ... , Yn 2 är observationer på 'f/ som är N (µ 2 , a). Här är µ 1 , µ 2 och a okända tal.
a) Härled ett konfidensintervall för medelhalten µ 1 ; µ 2 . b) Beräkna ett 90% konfidensintervall då
x = 24.2
Sx
y = 28.5
Sy=
= 1.6 2.3
11.48 Antag att livslängderna ~1 ,~ 2 , ... ,~n för n elektroniska komponenter är oberoende och exponentialfördelade med parameter A. Bestäm sannolikhetsfördelningen för livslängden hos ett system av dessa komponenter under förutsättning att komponenterna
a) seriekopplats,
b) parallellkopplats.
11.49 Man har två metall-legeringar M 1 och M2 med smältpunkterna µ 1 och µ 2 . Man gör en ny legering M3 som består av 20% M 1 , och 80% M2. Om smältpunkten µ 3 för M3 vet man av fysikaliska skäl att det är helt otänkbart att µ 3 > (µ 1 + 4µ 2 )/5. Man är intresserad av att visa att µ 3 < (µ 1 +4µ 2 )/5 och gör därför 10 smältpunktsbestämningar på vardera av M 1 , M2 och M3. Varje bestämning störs av ett mätfel som är N(e,0.3), där det systematiska felet e är okänt. Mätfelen vid de olika bestämningarna antas vara oberoende.
a) Formulera problemet som ett hypotesprövningsproblem. Ange nollhypotes, mothypotes, testvariabel och förkastelseområde. Varför gör det inget att e är okänt? b) Antag att i själva verket µ 1 = 437.8, µ 2 = 486.7, µ 3 = 476.7. Hur stor är sannolikheten att man upptäcker att µ 3 < (µ 1 +4µ 2 )/5 om man utför det ovan angivna testet på nivån 0.05? 11.50 Tidsavståndet mellan två pulser från ett GM-rör som utsätts för strålning från ett visst radioaktivt preparat är exponentialfördelat med väntevärde 2 sekunder. För att studera förloppet kopplar man till ©
Studentlitteratur
11.
299
Blandade övningar
GM-röret dels en pulsräknare, dels en dator som för varje puls beräknar och skriver ut tidsavståndet sedan föregående puls. Datorbearbetningen av varje puls tar 0.1 sekunder. Om en ny puls kommer medan bearbetningen av den föregående pågår så avbryts den första beräkningen och det tidsavståndet går förlorat. Man avser att studera 1000 pulser. Hur stor är sannolikheten att mer än 960 tidsavstånd skrivs ut·? 11.51 En termometer antas ge en felvisning som är N(µ, a)-fördelad, dvs när man mäter en viss temperatur 0 får man ett mätvärde som är N (0 + µ, a )-fördelat. Vid mätning av temperaturen hos isvatten och vattenånga, med de kända temperaturerna O respektive 100, fick man följande mätvärden
0.21, 0.03, 0.14, - 0.02
respektive
100.08, 99.92, 100.12
a) Beräkna lämpliga punktskattningar avµ och a. b) Beräkna ett 95 % symmetriskt konfidensintervall för µ. (Alla mätvärdena bör utnyttjas.)
©
Studentlitteratur
A. Tabeller
Grekiska alfabetet A B
r
~
(l
{3 'Y
E
8 c:,t:
z
(
H
T/
e
'IJ,0
I
l
K
K,
A M
.X µ
alfa beta gamma delta epsilon zeta eta theta iota kappa lambda my
N
-0
I/
~ 0
Il p E T y
7r
e,P c;, (1 T V
~
cp, '
X
1/;
[!
w
ny xi omikron pi ro sigma tau ypsilon
fi chi psi omega
301
Binomialfördelningen
302
Binomialfördelningen Tabellen ger sannolikheten P({ $ x) för givet x, där { E Bin(n,p). För p > 0.5 använd relationen P({ $ x) = P(r, ~ n - x) där T/ E Bin(n, 1 - p). När P({ $ x) = 1.0 skrivs detta ej ut. p
n
X
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
2 0 0.9025 0.8100 0.7225 0.6400 0.5625 0.4900 0.4225 0.3600 0.3025 0.2500 1 0.9975 0.9900 0.9775 0.9600 0.9375 0.9100 0.8775 0.8400 0.7975 0.7500 3 0 0.8574 0.7290 0.6141 0.5120 0.4219 0.3430 0.2746 0.2160 0.1664 0.1250 1 0.9928 0.9720 0.9393 0.8960 0.8438 0.7840 0.7183 0.6480 0.5748 0.5000 2 0.9999 0.9990 0.9966 0.9920 0.9844 0.9730 0.9571 0.9360 0.9089 0.8750 4 0 1 2 3
0.8145 0.9860 0.9995 1.0
0.6561 0.9477 0.9963 0.9999
0.522 0.8905 0.9880 0.9995
0.4096 0.8192 0.9728 0.9984
0.3164 0.7383 0.9492 0.9961
0.2401 0.6517 0.9163 0.9919
0.1785 0.5630 0.8735 0.9850
0.1296 0.4752 0.8208 0.9744
0.0915 0.3910 0.7585 0.9590
0.0625 0.3125 0.6875 0.9375
5 0 1 2 3 4
0.7738 0.9774 0.9988 1.0 1.0
0.5905 0.9185 0.9914 0.9995 1.0
0.4437 0.8352 0.9734 0.9978 0.9999
0.3277 0.7373 0.9421 0.9933 0.9997
0.2373 0.6328 0.8965 0.9844 0.9990
0.1681 0.5282 0.8369 0.9692 0.9976
0.1160 0.4284 0.7648 0.9460 0.9947
0.0778 0.3370 0.6826 0.9130 0.9898
0.0503 0.2562 0.5931 0.8688 0.9815
0.0313 0.1875 0.5000 0.8125 0.9688
6 0 1 2 3 4 5
0.7351 0.9672 0.9978 0.9999 1.0 1.0
0.5314 0.8857 0.9842 0.9987 0.9999 1.0
0.3771 0.7765 0.9527 0.9941 0.9996 1.0
0.2621 0.6554 0.9011 0.9830 0.9984 0.9999
0.178 0.5339 0.8306 0.9624 0.9954 0.9998
0.1176 0.4202 0.7443 0.9295 0.9891 0.9993
0.0754 0.3191 0.6471 0.8826 0.9777 0.9982
0.0467 0.2333 0.5443 0.8208 0.9590 0.9959
0.0277 0.1636 0.4415 0.7447 0.9308 0.9917
0.0156 0.1094 0.3438 0.6563 0.8906 0.9844
7 0 1 2 3 4 5 6
0.6983 0.9556 0.9962 0.9998 1.0 1.0 1.0
0.4783 0.8503 0.9743 0.9973 0.9998 1.0 1.0
0.3206 0.7166 0.9262 0.9879 0.9988 0.9999 1.0
0.2097 0.5767 0.8520 0.9667 0.9953 0.9996 1.0
0.1335 0.4449 0.7564 0.9294 0.9871 0.9987 0.9999
0.0824 0.3294 0.6471 0.8740 0.9712 0.9962 0.9998
0.049 0.2338 0.5323 0.8002 0.9444 0.9910 0.9994
0.0280 0.1586 0.4199 0.7102 0.9037 0.9812 0.9984
0.0152 0.1024 0.3164 0.6083 0.8471 0.9643 0.9963
0.0078 0.0625 0.2266 0.5000 0.7734 0.9375 0.9922
8 0 1 2 3 4 5 6 7
0.6634 0.9428 0.9942 0.9996 1.0 1.0 1.0 1.0
0.4305 0.8131 0.9619 0.9950 o.9996 1.0 1.0 1.0
0.2725 0.6572 0.8948 0.9786 o.9971 0.9998 1.0 1.0
0.1678 0.5033 0.7969 0.9437 o.9896 0.9988 0.9999 1.0
0.1001 0.3671 0.6785 0.8862 0.9121 0.9958 0.9996 1.0
0.0576 0.2553 0.5518 0.8059 o.9420 0.9887 0.9987 0.9999
0.0319 0.1691 0.4278 0.7064 o.8939 0.9747 0.9964 0.9998
0.0168 0.0084 0.1064 0.0632 0.3154 0.2201 0.5941 0.4770 o.8263 ·o.7396 0.9502 0.9115 0.9915 0.9819 0.9993 0.9983
0.0039 0.0352 0.1445 0.3633 o.6367 0.8555 0.9648 0.9961
© Studentlitteratur
303 p
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
0.6302 0.9288 0.9916 0.9994 1.0 1.0 1.0 1.0 1.0
0.3874 0.7748 0.9470 0.9917 0.9991 0.9999 1.0 1.0 1.0
0.2316 0.5995 0.8591 0.9661 0.9944 0.9994 1.0 1.0 1.0
0.1342 0.4362 0.7382 0.9144 0.9804 0.9969 0.9997 1.0 1.0
0.0751 0.3003 0.6007 0.8343 0.9511 0.9900 0.9987 0.9999 1.0
0.0404 0.1960 0.4628 0.7297 0.9012 0.9747 0.9957 0.9996 1.0
0.0207 0.1211 0.3373 0.6089 0.8283 0.9464 0.9888 0.9986 0.9999
0.0101 0.0705 0.2318 0.4826 0.7334 0.9006 0.9750 0.9962 0.9997
0.0046 0.0385 0.1495 0.3614 0.6214 0.8342 0.9502 0.9909 0.9992
0.0020 0.0195 0.0898 0.2539 0.5000 0.7461 0.9102 0.9805 0.9980
0.5987 0.9139 0.9885 0.9990 0.9999 1.0 1.0 1.0 1.0 1.0
0.3487 0.7361 0.9298 0.9872 0.9984 0.9999 1.0 1.0 1.0 1.0
0.1969 0.5443 0.8202 0.9500 0.9901 0.9986 0.9999 1.0 1.0 1.0
0.1074 0.3758 0.6778 0.8791 0.9672 0.9936 0.9991 0.9999 1.0 1.0
0.0563 0.2440 0.5256 0.7759 0.9219 0.9803 0.9965 0.9996 1.0 1.0
0.0282 0.1493 0.3828 0.6496 0.8497 0.9527 0.9894 0.9984 0.9999 1.0
0.0135 0.0860 0.2616 0.5138 0.7515 0.9051 0.9740 0.9952 0.9995 1.0
0.0060 0.0464 0.1673 0.3823 0.6331 0.8338 0.9452 0.9877 0.9983 0.9999
0.0025 0.0233 0.0996 0.2660 0.5044 0.7384 0.8980 0.9726 0.9955 0.9997
0.0010 0.0107 0.0547 0.1719 0.3770 0.6230 0.8281 0.9453 0.9893 0.999
0.5688 0.8981 0.9848 0.9984 0.9999 1.0 1.0 1.0 1.0 1.0 1.0
0.3138 0.6974 0.9104 0.9815 0.9972 0.9997 1.0 1.0 1.0 1.0 1.0
0.1673 0.4922 0.7788 0.9306 0.9841 0.9973 0.9997 1.0 1.0 1.0 1.0
0.0859 0.3221 0.6174 0.8389 0.9496 0.9883 0.998 0.9998 1.0 1.0 1.0
0.0422 0.1971 0.4552 0.7133 0.8854 0.9657 0.9924 0.9988 0.9999 1.0 1.0
0.0198 0.113 0.3127 0.5696 0.7897 0.9218 0.9784 0.9957 0.9994 1.0 1.0
0.0088 0.0606 0.2001 0.4256 0.6683 0.8513 0.9499 0.9878 0.9980 0.9998 1.0
0.0036 0.0302 0.1189 0.2963 0.5328 0.7535 0.9006 0.9707 0.9941 0.9993 1.0
0.0014 0.0139 0.0652 0.1911 0.3971 0.6331 0.8262 0.9390 0.9852 0.9978 0.9998
0.0005 0.0059 0.0327 0.1133 0.2744 0.5000 0.7256 0.8867 0.9673 0.9941 0.9995
0.5404 0.8816 0.9804 0.9978 0.9998 1.0 1.0 1.0 1.0 1.0 1.0 1.0
0.2824 0.6590 0.8891 0.9744 0.9957 0.9995 0.9999 1.0 1.0 1.0 1.0 1.0
0.1422 0.4435 0.7358 0.9078 0.9761 0.9954 0.9993 0.9999 1.0 1.0 1.0 1.0
0.0687 0.2749 0.5583 0.7946 0.9274 0.9806 0.9961 0.9994 0.9999 1.0 1.0 1.0
0.0317 0.1584 0.3907 0.6488 0.8424 0.9456 0.9857 0.9972 0.9996 1.0 1.0 1.0
0.0138 0.0850 0.2528 0.4925 0.7237 0.8822 0.9614 0.9905 0.9983 0.9998 1.0 1.0
0.0057 0.0424 0.1513 0.3467 0.5833 0.7873 0.9154 0.9745 0.9944 0.9992 0.9999 1.0
0.0022 0.0196 0.0834 0.2253 0.4382 0.6652 0.8418 0.9427 0.9847 0.9972 0.9997 1.0
0.0008 0.0083 0.0421 0.1345 0.3044 0.5269 0.7393 0.8883 0.9644 0.9921 0.9989 0.9999
0.0002 0.0032 0.0193 0.0730 0.1938 0.3872 0.6128 0.8062 0.9270 0.9807 0.9968 0.9998
®
Studentlitteratur
Binomialfördelningen
304 p
n
X
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
13
0 1 2 3 4 5 6 7 8 9 10 11 12
0.5133 0.8646 0.9755 0.9969 0.9997 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
0.2542 0.6213 0.8661 0.9658 0.9935 0.9991 0.9999 1.0 1.0 1.0 1.0 1.0 1.0
0.1209 0.3983 0.6920 0.8820 0.9658 0.9925 0.9987 0.9998 1.0 1.0 1.0 1.0 1.0
0.0550 0.2336 0.5017 0.7473 0.9009 0.9700 0.9930 0.9988 0.9998 1.0 1.0 1.0 1.0
0.0238 0.1267 0.3326 0.5843 0.7940 0.9198 0.9757 0.9944 0.9990 0.9999 1.0 1.0 1.0
0.0097 0.0637 0.2025 0.4206 0.6543 0.8346 0.9376 0.9818 0.9960 0.9993 0.9999 1.0 1.0
0.0037 0.0296 0.1132 0.2783 0.5005 0.7159 0.8705 0.9538 0.9874 0.9975 0.9997 1.0 1.0
0.0013 0.0126 0.0579 0.1686 0.3530 0.5744 0.7712 0.9023 0.9679 0.9922 0.9987 0.9999 1.0
0.0004 0.0049 0.0269 0.0929 0.2279 0.4268 0.6437 0.8212 0.9302 0.9797 0.9959 0.9995 1.0
0.0001 0.0017 0.0112 0.0461 0.1334 0.2905 0.5000 0.7095 0.8666 0.9539 0.9888 0.9983 0.9999
14
0 1 2 3 4 5 6 7 8 9 10 11 12 13
0.4877 0.8470 0.9699 0.9958 0.9996 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
0.2288 0.5846 0.8416 0.9559 0.9908 0.9985 0.9998 1.0 1.0 1.0 1.0 1.0 1.0 1.0
0.1028 0.3567 0.6479 0.8535 0.9533 0.9885 0.9978 0.9997 1.0 1.0 1.0 1.0 1.0 1.0
0.0440 0.1979 0.4481 0.6982 0.8702 0.9561 0.9884 0.9976 0.9996 1.0 1.0 1.0 1.0 1.0
0.0178 0.1010 0.2811 0.5213 0.7415 0.8883 0.9617 0.9897 0.9978 0.9997 1.0 1.0 1.0 1.0
0.0068 0.0475 0.1608 0.3552 0.5842 0.7805 0.9067 0.9685 0.9917 0.9983 0.9998 1.0 1.0 1.0
0.0024 0.0205 0.0839 0.2205 0.4227 0.6405 0.8164 0.9247 0.9757 0.9940 0.9989 0.9999 1.0 1.0
0.0008 0.0081 0.0398 0.1243 0.2793 0.4859 0.6925 0.8499 0.9417 0.9825 0.9961 0.9994 0.9999 1.0
0.0002 0.0029 0.0170 0.0632 0.1672 0.3373 0.5461 0.7414 0.8811 0.9574 0.9886 0.9978 0.9997 1.0
0.0001 0.0009 0.0065 0.0287 0.0898 0.2120 0.3953 0.6047 0.7880 0.9102 0.9713 0.9935 0.9991 0.9999
15
0 1 2 3 4 5 6 7 8 9 10 11 12 13
0.4633 0.8290 0.9638 0.9945 0.9994 0.9999 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
0.2059 0.5490 0.8159 0.9444 0.9873 0.9978 0.9997 1.0 1.0 1.0 1.0 1.0 1.0 1.0
0.0874 0.3186 0.6042 0.8227 0.9383 0.9832 0.9964 0.9994 0.9999 1.0 1.0 1.0 1.0 1.0
0.0352 0.1671 0.3980 0.6482 0.8358 0.9389 0.9819 0.9958 0.9992 0.9999 1.0 1.0 1.0 1.0
0.0134 0.0802 0.2361 0.4613 0.6865 0.8516 0.9434 0.9827 0.9958 0.9992 0.9999 1.0 1.0 1.0
0.0047 0.0353 0.1268 0.2969 0.5155 0.7216 0.8689 0.9500 0.9848 0.9963 0.9993 0.9999 1.0 1.0
0.0016 0.0142 0.0617 0.1727 0.3519 0.5643 0.7548 0.8868 0.9578 0.9876 0.9972 0.9995 0.9999 1.0
0.0005 0.0052 0.0271 0.0905 0.2173 0.4032 0.6098 0.7869 0.9050 0.9662 0.9907 0.9981 0.9997 1.0
0.0001 0.0017 0.0107 0.0424 0.1204 0.2608 0.4522 0.6535 0.8182 0.9231 0.9745 0.9937 0.9989 0.9999
0.0000 0.0005 0.0037 0.0176 0.0592 0.1509 0.3036 0.5000 0.6964 0.8491 0.9408 0.9824 0.9963 0.9995
© Studentlitteratur
305 p
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
0.4401 0.8108 0.9571 0.9930 0.9991 0.9999 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
0.1853 0.5147 0.7892 0-.9316 0.9830 0.9967 0.9995 0.9999 1.0 1.0 1.0 1.0 1.0 1.0 1.0
0.0743 0.2839 0.5614 0.7899 0.9209 0.9765 0.9944 0.9989 0.9998 1.0 1.0 1.0 1.0 1.0 1.0
0.0281 0.1407 0.3518 0.5981 0.7982 0.9183 0.9733 0.9930 0.9985 0.9998 1.0 1.0 1.0 1.0 1.0
0.0100 0.0635 0.1971 0.4050 0.6302 0.8103 0.9204 0.9729 0.9925 0.9984 0.9997 1.0 1.0 1.0 1.0
0.0033 0.0261 0.0994 0.2459 0.4499 0.6598 0.8247 0.9256 0.9743 0.9929 0.9984 0.9997 1.0 1.0 1.0
0.0010 0.0098 0.0451 0.1339 0.2892 0.4900 0.6881 0.8406 0.9329 0.9771 0.9938 0.9987 0.9998 1.0 1.0
0.0003 0.0033 0.0183 0.0651 0.1666 0.3288 0.5272 0.7161 0.8577 0.9417 0.9809 0.9951 0.9991 0.9999 1.0
0.0001 0.0010 0.0066 0.0281 0.0853 0.1976 0.3660 0.5629 0.7441 0.8759 0.9514 0.9851 0.9965 0.9994 0.9999
0.0000 0.0003 0.0021 0.0106 0.0384 0.1051 0.2272 0.4018 0.5982 0.7728 0.8949 0.9616 0.9894 0.9979 0.9997
0.4181 0.7922 0.9497 0.9912 0.9988 0.9999 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
0.1668 0.4818 0.7618 0.9174 0.9779 0.9953 0.9992 0.9999 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
0.0631 0.2525 0.5198 0.7556 0.9013 0.9681 0.9917 0.9983 0.9997 1.0 1.0 1.0 1.0 1.0 1.0 1.0
0.0225 0.1182 0.3096 0.5489 0.7582 0.8943 0.9623 0.9891 0.9974 0.9995 0.9999 1.0 1.0 1.0 1.0 1.0
0.0075 0.0501 0.1637 0.3530 0.5739 0.7653 0.8929 0.9598 0.9876 0.9969 0.9994 0.9999 1.0 1.0 1.0 1.0
0.0023 0.0193 0.0774 0.2019 0.3887 0.5968 0.7752 0.8954 0.9597 0.9873 0.9968 0.9993 0.9999 1.0 1.0 1.0
0.0007 0.0067 0.0327 0.1028 0.2348 0.4197 0.6188 0.7872 0.9006 0.9617 0.9880 0.9970 0.9994 0.9999 1.0 1.0
0.0002 0.0021 0.0123 0.0464 0.1260 0.2639 0.4478 0.6405 0.8011 0.9081 0.9652 0.9894 0.9975 0.9995 0.9999 1.0
0.0000 0.0006 0.0041 0.0184 0.0596 0.1471 0.2902 0.4743 0.6626 0.8166 0.9174 0.9699 0.9914 0.9981 0.9997 1.0
0.0000 0.0001 0.0012 0.0064 0.0245 0.0717 0.1662 0.3145 0.5000 0.6855 0.8338 0.9283 0.9755 0.9936 0.9988 0.9999
0.3972 0.7735 0.9419 0.9891 0.9985 0.9998 1.0 1.0 1.0 1.0 1.0 1.0 1.0
0.1501 0.4503 0.7338 0.9018 0.9718 0.9936 0.9988 0.9998 1.0 1.0 1.0 1.0 1.0
0.0536 0.2241 0.4797 0.7202 0.8794 0.9581 0.9882 0.9973 0.9995 0.9999 1.0 1.0 1.0
0.0180 0.0991 0.2713 0.5010 0.7164 0.8671 0.9487 0.9837 0.9957 0.9991 0.9998 1.0 1.0
0.0056 0.0395 0.1353 0.3057 0.5187 0.7175 0.8610 0.9431 0.9807 0.9946 0.9988 0.9998 1.0
0.0016 0.0142 0.0600 0.1646 0.3327 0.5344 0. 7217 0.8593 0.9404 0.9790 0.9939 0.9986 0.9997
0.0004 0.0046 0.0236 0.0783 0.1886 0.3550 0.5491 0.7283 0.8609 0.9403 0.9788 0.9938 0.9986
0.0001 0.0013 0.0082 0.0328 0.0942 0.2088 0.3743 0.5634 0.7368 0.8653 0.9424 0.9797 0.9942
0.0000 0.0003 0.0025 0.0120 0.0411 0.1077 0.2258 0.3915 0.5778 0.7473 0.8720 0.9463 0.9817
0.0000 0.0001 0.0007 0.0038 0.0154 0.0481 0.1189 0.2403 0.4073 0.5927 0.7597 0.8811 0.9519
©
Studentlitteratur
Binomialfördelningen
306 p
n
X
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
18 13 14 15 16
1.0 1.0 1.0 1.0
1.0 1.0 1.0 1.0
1.0 1.0 1.0 1.0
1.0 1.0 1.0 1.0
1.0 1.0 1.0 1.0
1.0 1.0 1.0 1.0
0.9997 1.0 1.0 1.0
0.9987 0.9998 1.0 1.0
0.9951 0.9990 0.9999 1.0
0.9846 0.9962 0.9993 0.9999
19
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
0.3774 0.7547 0.9335 0.9868 0.9980 0.9998 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
0.1351 0.4203 0.7054 0.8850 0.9648 0.9914 0.9983 0.9997 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
0.0456 0.1985 0.4413 0.6841 0.8556 0.9463 0.9837 0.9959 0.9992 0.9999 1.0 1.0 1.0 1.0 1.0 1.0 1.0
0.0144 0.0829 0.2369 0.4551 0.6733 0.8369 0.9324 0.9767 0.9933 0.9984 0.9997 1.0 1.0 1.0 1.0 1.0 1.0
0.0042 0.0310 0.1113 0.2631 0.4654 0.6678 0.8251 0.9225 0.9713 0.9911 0.9977 0.9995 0.9999 1.0 1.0 1.0 1.0
0.0011 0.0104 0.0462 0.1332 0.2822 0.4739 0.6655 0.8180 0.9161 0.9674 0.9895 0.9972 0.9994 0.9999 1.0 1.0 1.0
0.0003 0.0031 0.0170 0.0591 0.1500 0.2968 0.4812 0.6656 0.8145 0.9125 0.9653 0.9886 0.9969 0.9993 0.9999 1.0 1.0
0.0001 0.0008 0.0055 0.0230 0.0696 0.1629 0.3081 0.4878 0.6675 0.8139 0.9115 0.9648 0.9884 0.9969 0.9994 0.9999 1.0
0.0000 0.0002 0.0015 0.0077 0.0280 0.0777 0.1727 0.3169 0.4940 0.6710 0.8159 0.9129 0.9658 0.9891 0.9972 0.9995 0.9999
0.0000 0.0000 0.0004 0.0022 0.0096 0.0318 0.0835 0.1796 0.3238 0.5000 0.6762 0.8204 0.9165 0.9682 0.9904 0.9978 0.9996
20
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
0.3585 0.7358 0.9245 0.9841 0.9974 0.9997 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
0.1216 0.3917 0.6769 0.8670 0.9568 0.9887 0.9976 0.9996 0.9999 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
0.0388 0.1756 0.4049 0.6477 0.8298 0.9327 0.9781 0.9941 0.9987 0.9998 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
0.0115 0.0692 0.2061 0.4114 0.6296 0.8042 0.9133 0.9679 0.9900 0.9974 0.9994 0.9999 1.0 1.0 1.0 1.0 1.0 1.0
0.0032 0.0243 0.0913 0.2252 0.4148 0.6172 0.7858 0.8982 0.9591 0.9861 0.9961 0.9991 0.9998 1.0 1.0 1.0 1.0 1.0
0.0008 0.0076 0.0355 0.1071 0.2375 0.4164 0.6080 0.7723 0.8867 0.9520 0.9829 0.9949 0.9987 0.9997 1.0 1.0 1.0 1.0
0.0002 0.0021 0.0121 0.0444 0.1182 0.2454 0.4166 0.6010 0.7624 0.8782 0.9468 0.9804 0.9940 0.9985 0.9997 1.0 1.0 1.0
0.0000 0.0005 0.0036 0.0160 0.0510 0.1256 0.2500 0.4159 0.5956 0.7553 0.8725 0.9435 0.9790 0.9935 0.9984 0.9997 1.0 1.0
0.0000 0.0001 0.0009 0.0049 0.0189 0.0553 0.1299 0.2520 0.4143 0.5914 0.7507 0.8692 0.9420 0.9786 0.9936 0.9985 0.9997 1.0
0.0000 0.0000 0.0002 0.0013 0.0059 0.0207 0.0577 0.1316 0.2517 0.4119 0.5881 0.7483 0.8684 0.9423 0.9793 0.9941 0.9987 0.9998
©
Studentlitteratur
len ger sannolikheten P(e::; x) för givet x,där
eE Po(>..).
>.. 0.1 0.9048 0.9953 0.9998 1.0 1.0 1.0
0.2 0.S187 0.9825 0.9989 0.9999 1.0 1.0
0.3 0.7408 0.9631 0.9964 0.9997 1.0 1.0
0.4 0.6703 0.9384 0.9921 0.9992 0.9999 1.0
0.5 0.6065 0.9098 0.9856 0.9982 0.9998 1.0
1.0 0.3679 0.7358 0.9197 0.9810 0.9963 0.9994 0.9999 1.0 1.0
1.1
0.3329 0.699 0.9004 0.9743 0.9946 0.999 0.9999 1.0 1.0
1.2 0.3012 0.6626 0.8795 0.9662 0.9923 0.9985 0.9997 1.0 1.0
1.3 0.2725 0.6268 0.8571 0.9569 0.9893 0.9978 0.9996 0.9999 1.0
1.4 0.2466 0.5918 0.8335 0.9463 0.9857 0.9968 0.9994 0.9999 1.0
1.9 0.1496 0.4337 0.7037 0.8747 0.9559 0.9868 0.9966 0.9992 0.9998 1.0 1.0 1.0 1.0
2.0 0.1353 0.4060 0.6767 0.8571 0.9473 0.9834 0.9955 0.9989 0.9998 1.0 1.0 1.0 1.0
2.2 0.1108 0.3546 0.6227 0.8194 0.9275 0.9751 0.9925 0.9980 0.9995 0.9999 1.0 1.0 1.0
2.4 0.0907 0.3084 0.5697 0.7787 0.9041 0.9643 0.9884 0.9967 0.9991 0.9998 1.0 1.0 1.0
2.6 0.0743 0.2674 0.5184 0.736 0.8774 0.9510 0.9828 0.9947 0.9985 0.9996 0.9999 1.0 1.0
3.6 0.0273 0.1257 0.3027 0.5152 0.7064 0.8441
3.8 0.0224 0.1074 0.2689 0.4735 0.6678 0.8156
4.0 0.0183 0.0916 0.2381 0.4335 0.6288 0.7851
4.2 0.015 0.078 0.2102 0.3954 0.5898 0.7531
4.4 0.0123 0.0663 0.1851 0.3594 0.5512 0.7199
0.6 0.5488 0.8781 0.9769 0.9966 0.9996 1.0
0.7 0.4966 0.8442 0.9659 0.9942 0.9992 0.9999
0.8 0.4493 0.8088 0.9526 0.9909 0.9986 0.9998
0.9 0.4066 0.7725 0.9371 0.9865 0.9977 0.9997
1.5 0.2231 0.5578 0.8088 0.9344 0.9814 0.9955 0.9991 0.9998 1.0
1.6 0.20190 0.5249 0.7834 0.9212 0.9763 0.9940 0.9987 0.9997 1.0
1.7 0.1827 0.4932 0.7572 0.9068 0.9704 0.9920 0.9981 0.9996 0.9999
1.8 0.1653 0.4628 0.7306 0.8913 0.9636 0.9896 0.9974 0.9994 0.9999
2.8 0.0608 0.2311 0.4695 0.6919 0.8477 0.9349 0.9756 0.9919 0.9976 0.9993 0.9998 1.0 1.0
3.0 0.0498 0.1991 0.4232 0.6472 0.8153 0.9161 0.9665 0.9881 0.9962 0.9989 0.9997 0.9999 1.0
3.2 0.0408 0.1712 0.3799 0.6025 0.7806 0.8946 0.9554 0.9832 0.9943 0.9982 0.9995 0.9999 1.0
3.4 0.0334 0.1468 0.3397 0.5584 0.7442 0.8705 0.9421 0.9769 0.9917 0.9973 0.9992 0.9998 0.9999
4.6 0.0101 0.0563 0.1626 0.3257 0.5132 0.6858
4.8 0.0082 0.0477 0.1425 0.2942 0.4763 0.6510
5.0 0.0067 0.0404 0.1247 0.2650 0.4405 0.6160
6.0 0.0025 0.0174 0.0620 0.1512 0.2851 0.4457
>..
>..
>..
©
Studentlitteratur
Poissonfördelningen
308 ,\ X
6 7 8 9 10 11 12 13 14 15 16 17
3.6 0.9267 0.9692 0.9883 0.996 0.9987 0.9996 0.9999 1.0 1.0 1.0 1.0 1.0
3.8 0.9091 0.9599 0.9840 0.9942 0.9981 0.9994 0.9998 1.0 1.0 1.0 1.0 1.0
4.0 0.8893 0.9489 0.9786 0.9919 0.9972 0.9991 0.9997 0.9999 1.0 1.0 1.0 1.0
4.2 0.8675 0.9361 0.9721 0.9889 0.9959 0.9986 0.9996 0.9999 1.0 1.0 1.0 1.0
4.4 0.8436 0.9214 0.9642 0.9851 0.9943 0.9980 0.9993 0.9998 0.9999 1.0 1.0 1.0
7 0.0009 0.0073 0.0296 0.0818 0.1730 0.3007 0.4497 0.5987 0.7291 0.8305 0.9015 0.9467 0.9730 0.9872 0.9943 0.9976 0.9990 0.9996 0.9999 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
8 0.0003 0.0030 0.0138 0.0424 0.0996 0.1912 0.3134 0.4530 0.5925 0.7166 0.8159 0.8881 0.9362 0.9658 0.9827 0.9918 0.9963 0.9984 0.9993 0.9997 0.9999 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
9 0.0001 0.0012 0.0062 0.0212 0.0550 0.1157 0.2068 0.3239 0.4557 0.5874 0.7060 0.803 8.8758 0.9261 0.9585 0.9780 0.9889 0.9947 0.9976 0.9989 0.9996 0.9998 0.9999 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0
10 0.0000 0.0005 0.0028 0.0103 0.0293 0.0671 0.1301 0.2202 0.3328 0.4579 0.5830 0.6968 0.7916 0.8645 0.9165 0.9513 0.9730 0.9857 0.9928 0.9965 0.9984 0.9993 0.9997 0.9999 1.0 1.0 1.0 1.0 1.0 1.0 1.0
11
4.6 0.818 0.9049 0.9549 0.9805 0.9922 0.9971 0.9990 0.9997 0.9999 1.0 1.0 1.0
4.8 0.7908 0.8867 0.9442 0.9749 0.9896 0.996 0.9986 0.9995 0.9999 1.0 1.0 1.0
5.0 0.7622 0.8666 0.9319 0.9682 0.9863 0.9945 0.9980 0.9993 0.9998 0.9999 1.0 1.0
6.0 0.6063 0.7440 0.8472 0.9161 0.9574 0.9799 0.9912 0.9964 0.9986 0.9995 0.9998 0.9999
12 0.0 0.0001 0.0005 0.0023 0.0076 0.0203 0.0458 0.0895 0.1550 0.2424 0.3472 0.4616 0.5760 0.6815 0.7720 0.8444 0.8987 0.9370 0.9626 0.9787 0.9884 0.9939 0.9970 0.9985 0.9993 0.9997 0.9999 0.9999 1.0 1.0 1.0
13 0.0 0.0 0.0002 0.0011 0.0037 0.0107 0.0259 0.0540 0.0998 0.1658 0.2517 0.3532 0.4631 0.5730 0.6751 0.7636 0.8355 0.8905 0.9302 0.9573 0.9750 0.9859 0.9924 0.9960 0.9980 0.9990 0.9995 0.9998 0.9999 1.0 1.0
14 0.0 0.0 0.0001 0.0005 0.0018 0.0055 0.0142 0.0316 0.0621 0.1094 0.1757 0.2600 0.3585 0.4644 0.5704 0.6694 0.7559 0.8272 0.8826 0.9235 0.9521 0.9712 0.9833 0.9907 0.9950 0.9974 0.9987 0.9994 0.9997 0.9999 0.9999
15 0.0 0.0 0.0 0.0002 0.0009 0.0028 0.0076 0.0180 0.0374 0.0699 0.1185 0.1848 0.2676 0.3632 0.4657 0.5681 0.6641 0.7489 0.8195 0.8752 0.9170 0.9469 0.9673 0.9805 0.9888 0.9938 0.9967 0.9983 0.9991 0.9996 0.9998
,\ X
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
© Studentlitteratur
0.0000 0.0002 0.0012 0.0049 0.0151 0.0375 0.0786 0.1432 0.2320 0.3405 0.4599 0.5793 0.6887 0.7813 0.8540 0.9074 0.9441 0.9678 0.9823 0.9907 0.9953 0.9977 0.9990 0.9995 0.9998 0.9999 1.0 1.0 1.0 1.0 1.0
Tabeller
309
Normalfördelningen Tabellen ger sannolikheten .a) Q
>.a Q
>.a
0.1
0.05
1.2816 1.6449
-3
©
Studentlitteratur
-2
eE N(0, 1).
där
0.025
O.Dl
0.005
0.001
1.9600
2.3263
2.5758
3.0902
0.0005 0.0001 0.00005 0.00001 5.0 3.2905 3.7190
= a,
3.8906
-1
4.2649
0
X
10- 6
1.0
4.4172
1
2
X
10- 6
4.7534
3
311
Tabeller
t-fördelningen Tabellen ger det x-värde för vilket P(~
> x) = o , där~ E t(/).
Q
f
.1
1 2 3 4 5
3.078 1.886 1.638 1.533 1.476
.0005 .005 .001 6.314 12.706 31.821 63.657 318.309 636.619 2.920 4.303 6.965 9.925 22.327 31.599 2.353 3.182 4.541 5.841 10.215 12.924 7.173 8.610 2.132 2.776 3.747 4.604 5.893 6.869 2.015 2.571 3.365 4.032 .025
.01
6 1.440 1.943 7 1.415 1.895 8 1.397 1.860 9 1.383 1.833 10 1.372 1.812
2.447 2.365 2.306 2.262 2.228
3.143 2.998 2.896 2.821 2.764
3.707 3.499 3.355 3.250 3.169
5.208 4.785 4.501 4.297 4.144
5.959 5.408 5.041 4.781 4.587
11 1.363 1.796 12 1.356 1.782 13 1.350 1.771 14 1.345 1.761 15 1.341 1.753
2.201 2.179 2.160 2.145 2.131
2.718 2.681 2.650 2.624 2.602
3.106 3.055 3.012 2.977 2.947
4.025 3.930 3.852 3.787 3.733
4.437 4.318 4.221 4.140 4.-073
16 1.337 1.746 17 1.333 1.740 18 1.330 1.734 19 1.328 1.729 20 1.325 1.725
2.120 2.110 2.101 2.093 2.086
2.583 2.567 2.552 2.539 2.528
2.921 2.898 2.878 2.861 2.845
3.686 3.646 3.610 3.579 3.552
4.015 3.965 3.922 3.883 3.850
21 1.323 1.721 22 1.321 1.717 23 1.319 1.714 24 1.318 1.711 25 1.316 1.708
2.080 2.074 2.069 2.064 2.060
2.518 2.508 2.500 2.492 2.485
2.831 2.819 2.807 2.797 2.787
3.527 3.505 3.485 3.467 3.450
3.819 3.792 3.768 3.745 3.725
1.706 1.703 1.701 1.699 1.697
2.056 2.052 2.048 2.045 2.042
2.479 2.473 2.467 2.462 2.457
2.779 2.771 2.763 2.756 2.750
3.435 3.421 3.408 3.396 3.385
3.707 3.690 3.674 3.659 3.646
40 1.303 1.684 60 1.296 1.671 120 1.289 1.658 1.282 1.645 00
2.021 2.000 1.980 1.960
2.423 2.390 2.358 2.326
2.704 2.660 2.617 2.576
3.307 3.232 3.160 3.090
3.551 3.460 3.373 3.291
26 27 28 29 30
1.315 1.314 1.313 1.311 1.310
.05
©
Studentlitteratur
x 2 -fördelningen
312
x2-fördelningen Tabellen ger det x-värde för vilket
P(e > x) = et, där eE x
2
(f).
Ct
.10
.05
.025
.01
0.004 0.103 0.352 0.711 1.145
.90 0.016 0.211 0.584 1.064 1.610
2.706 4.605 6.251 7.779 9.236
1.237 1.690 2.180 2.700 3.247
1.635 2.167 2.733 3.325 3.940
2.204 2.833 3.490 4.168 4.865
10.645 12.017 13.362 14.684 15.987
12.592 14.067 15.507 16.919 18.307
14.449 16.013 17.535 19.023 20.483
16.812 18.475 20.090 21.670 23.209
3.053 3.571 4.107 4.660 5.229
3.816 4.404 5.009 5.629 6.262
4.575 5.226 5.892 6.571 7.261
5.578 6.304 7.042 7.790 8.547
17.275 18.549 19.812 21.064 22.307
19.675 21.026 22.362 23.685 25.000
21.920 23.337 24.736 26.119 27.488
24.725 26.217 27.688 29.141 30.578
16 17 18 19 20
5.812 6.408 7.015 7.633 8.260
6.908 7.962 9.312 7.564 8.672 10.085 8.231 9.390 10.865 8.907 10.117 11.651 9.591 10.851 12.443
23.542 24.769 25.989 27.204 28.412
26.296 27.587 28.869 30.144 31.410
28.845 30.191 31.526 32.852 34.170
32.000 33.409 34.805 36.191 37.566
21 22 23 24 25
8.897 9.542 10.196 10.856 11.524
10.283 10.982 11.689 12.401 13.120
11.591 12.338 13.091 13.848 14.611
13.240 14.042 14.848 15.659 16.473
29.615 30.813 32.007 33.196 34.382
32.671 33.924 35.173 36.415 37.653
35.479 36.781 38.076 39.364 40.647
38.932 40.289 41.638 42.980 44.314
26 27 28 29 30 40 50 60 70 80 90 100
12.198 12.879 13.565 14.257 14.954 22.164 29.706 37.484 45.441 53.540 61.754 70.049
13.844 14.573 15.308 16.047 16.791 24.433 32.357 40.482 48.758 57.153 65.647 74.216
15.380 16.151 16.928 17.708 18.493 26.509 34.764 43.188 51.739 60.392 69.126 77.929
17.292 18.114 18.939 19.768 20.599 29.050 37.689 46.459 55.329 64.278 73.291 82.362
35.563 36.741 37.916 39.088 40.256 51.805 63.167 74.397 85.527 96.578 107.56 118.49
38.885 40.113 41.337 42.557 43.773 55.758 67.505 79.082 90.531 101.88 113.14 124.34
41.923 43.195 44.462 45.722 46.979 59.342 71.420 83.298 95.023 106.63 118.14 129.56
45.642 46.963 48.278 49.588 50.892 63.691 76.154 88.379 100.42 112.33 1~4.12 135.82
.975
.95
1 2 3 4 5
.99 0.000 0.020 0.115 0.297 0.554
0.000 0.050 0.216 0.484 0.831
6 7 8 9 10
0.872 1.239 1.647 2.088 2.558
11 12 13 14 15
f
©
Studentlitteratur
3.841 5.024 6.635 5.991 7.378 9.210 7.815 9.348 11.345 9.488 11.143 13.277 11.07 12.833 15.086
B. Svar
1.1 Median 12.3 Medelvärde 12.27 Variations bredd 0.4 Standardavvikelse 0.125 Varians 0.157
1.5 Typvärde 357.5 Median 373.6 Medelvärde 376 Variations bredd 55 K vartilavstånd 24.29 Standardavvikelse 14.99
1.2 A B Median 275 425 Medelvärde 427 400 Variations bredd 1000 460 Standardavvikelse 329 152
2.1
~!o
a) = 0.0048 b) c) 7 = 0.429
f4
= 0.071
2.2 1.3 Typvärde 3 Median 4 Medelvärde 3.88 Variations bredd 10 Standardavvikelse 2.05 4.22 Varians
a) c) e)
PJlt
b) ~;4 =_0.350 0.400 d) \Pi° 1 _- 0.833 0.167 f) 143 - 0.566
=
1 1001 -
2.3
j
b)
efg = 0.071
t
b)
M= 0.424
a) = 0.071 c) 99 = 0.283
1.4 Utan Typvärde 10 11 Median 11.2 Medelvärde 9 Variations bredd Standardavvikelse 1.79 3.21 Varians
:'bb =_0.084
1
Med 11 11 11.0 9 1.85 3.41
2.4
a) 7 2 = 0.044 c) 33 = 0.152
2.5 a) \ = 0.145 c) 190 = 0.174
2.6 0.9721
313
Il
b) = 0.421 d) 19 = 0.579
314
2.7
2.12
a) P(mittemot varandra) = ½, P(bredvid varandra) = b) Förhoppningsvis att det är fel. Motivering framgår av a).
i
d) Ae n Be
eller
(AU Bt
A
2.8
a) b) c) d) e)
{ i I i E N, i :5 200 }, diskret R+, kontinuerligt Z+, diskret R+, kontinuerligt R+, kontinuerligt
2.13
a) (AU BU Ct eller Ae n Ben ce
2.9
a) 0.6 2.10 0.5 2.11 Nej 2.12
b) 0.3 b) (AUBUC)n n ((An B) u (B n C) u (C n A)) eller
(An Ben ce) U (Ae n B n ce)u u(Ae nBe nC)
a) An Be
c) ((AnB)U(BnC)u(CnA))n n(AnBnCt eller (An B n ce) u (An Be n C)u U(Ae n B nC)
©
Studentlitteratur
315
Svar
2.13
2.24
:~B
d) AnBnC
b) 0.49
2.25 0.85 2.26
a) 0.993
b) 0.016
2.27 0.047
2.14
a) 0.07
a) 0.96
b) 0.93
2.28 0.145 2.29 Nej
2.15
a) 0.25 c) 0.15
2.30 0.5
b) 0.05 d) 0.20
2.31
a) 0.0008
b) 0.0592
2.16
a) c)
M= o.41 f2 = 0.08
b) ~ = 0.53
2.32
a) 0.56
2.17 0.433
b) 0.94
2.33
2.18 0.43
a) 0.73
2.19 Nej, P(röd) =
b) 0.9993
i 2.34 0.59
2.20
a) 0.91 c) 0.13
2.35
b) 0.44 d) 0.90
2.21
a) 0.6 c) Vägen via c
b) 2p- p 2
2.36 0.35
b) 0.7
2.37
a) 0.63 c) 0.01
2.22 Kvinnor 2.23
a) 0.36 c) 0.23
a) p2 c) 2p2 - P3
b) 69
2.38
b) 0.41
a) 0.17592 c) 0.18784
b) 0.01168
©
Studentlitteratur
316
3.1
2.39
a) 0.72 c) 0.9216
F(x)
b) 0.9504 0.5
2.40 0.036 2.41
a) 0.19 c) 0.65
b) 0.057 d) 0.987
~n_ L,J-m
2
3
4
X
3.2 x
2.42 0.32 2.43
1
Q
IO
1
a) p(x) 0.91 0.09
(~)pi(l -
p(x)
Pt-i
J
2.44
a) 0.17
b) 0.88 0
2.45
b)
a) 0.352
b) 0.576
I
1 x 0 p(x) 0.87 0.13 p(x)
3.1
p(x)
F(x)
x=0
{ 0125 0.375 0.375 0.125
=
{
x=l x=2 x=3
0 0.125 0.5 0.875 1
x 193.99 d) 0.94
= 0.997, S(66) = 0.88.
9.8 Ho förkastas på 10% signifikansnivå ty x < 5.15, dvs om man är villig att ta 10% felrisk så kan man påstå att stavarna tål mindre än det angivna värdet. 9.9
b) 11
a) 0.61
=8
H1 : µ > 8
9.2
9.10 Ho : µ
a) Ho förkastas på 1% signifikansnivå. c) Ho förkastas ej på 1% signifikansnivå.
a) Ho kan ej förkastas på 0.1% signifikansnivå, ty x < 8.89. På 0.1% signifikansnivå kan man inte påstå att leverantören har fel. b) Ho förkastas på 5% signifikansnivå, ty x > 8.47. Med 5% felrisk kan man påstå att leverantören har fel.
9.3
a) n = 25 b) Förkasta Ho på nivan 5% om 104.93. 9.4 n 23.96.
=
20.
x>
Förkasta Ho om x
1150.65. Alltså kan vi ej skicka tillbaka sändningen och påstå att µ < 1200. b) S(ll00) = 0.95 9.6 n = 16. 5923.42.
Förkasta Ho om x >
© Studentlitteratur
9.11
a) Ho förkastas ej på 5% signifikansnivå ty 1048.57 < x < 1050.43. b) S(1051) = 0.28, S(1053) = 0.985 c) På 5% signifikansnivå kan man inte påstå att smältpunkten är skild från 1050°. Men man har inte heller styrkt att den är 1050° .Det enda man kan säga är att det inte finns tillräckligt belägg för att smältpunkten skulle vara skild från 1050°.
Svar
329
9.12
9.16 Ho:µ= 785 H1: µ < 785 Ho förkastas på 5% signifikansnivå ty Jj = -2.86 < -1.89, dvs misstanken stämmer om man har signifikansnivån 5%.
a) Ho : µ = 180 H1 : µ > 180 Ho förkastas på 1% signifikansnivå ty x > 181.07. På 1% signifikansnivå kan man alltså pästå att den genomsn.ittliga sträckgränsen har ökat. b) S(l81) = 0.44
9.17
a) Ho : µ = 5.5 H1 : µ =f. 5.5 Förkasta Ho om t = > 2.02 eller om t = < -2.02. b) Ho kan ej förkastas på 10% signifikansnivå ty -2.02 < t < 2.02. c) Ho förkastas på 10% signifikansnivå ty t > 2.02.
~//6
~!Ts
9.13
a) Ho : µ = 1.75 H1 : µ > 1.75 Ho kan ej förkastas på 0.1% signifikansnivå ty x < 2.14. Svaret på frågan är därför nej.
b)
~1
9.18 Förkasta inte Ho om intervallet )-oo,x + >.au/Jn) täcker µ 0 •
•{"'>
9.19
. , --e:-------r 9.14
a) [100.67, oo[ b) Ho förkastas på 5% signifikansnivå. 9.20
a) Ho : µ 8 = 48.0 H1 : µ 8 > 48.0 Ho förkastas på signifikansnivån o om ; 1 > t 0 (19) b) Ho kan ej förkastas på 10% signifikansnivå. c) Ho förkastas på 0.05% signifikansnivå.
Jn
a) )-oo, 5.23) b) Ho förkastas ej på 1% signifikansnivå. 9.21 [x - 0.88, x + 0.88) 9.22 a) flo förkastas på 5% signifikansnivå ty P( ~ 9 1 P = o.o5 > = 0.033 < 0.05 b) Ho förkastas inte på 5% signifikansnivå ty P( ~ 9 I p = 0.05 ) = 0.033 > 0.025
e
9.15
a) Ho : µ = 200 H1 : µ > 200 Ho kan ej förkastas på 5% signifikansnivå ty ~ = 1. 71 < 1.83. s/vlO b) Ho:µ= 200 H1 : µ < 200 Ho kan ej förkastas på 5% signifikansnivå ty = 1. 71 > -1.83.
!;JW
e
9.23 Ho förkastas på 2% signifikansnivå ty P( ~ 8 I p = 0.01) ~ 0.012 < 0.02.
e
©
Studentlitteratur
330
9.24 Ho förkastas inte på 1% signifikansnivå ty P( € 2'. 60 I p = 0.2) ~ 0.08 > 0.01.
9.31
b) Ho förkastas på 5% signifikansnivå ty
9.25
=
P( € ::; 2 / Ho sann)
a) 0.048
b) 0.72
9.26
a) 0.034
9.32 Ho köttbullarna likvärdiga H 1 : Findus bättre Ho förkastas på 1% signifikansnivå ty
b) 0.85
9.27
P( € 2'. 120 I Ho sann)
a) 0.0105 b) Ho : p = 0.01 H1 : p > 0.01 Ho förkastas inte på 0.1% signifikansnivå, dvs bötesklausulen bör inte träda i kraft.
~
0.002
6. b) Test 1: S(0.34) = 0.89, Test 2: S(0.34) = 0.74. c) Test 1 eftersom dess styrka i ~ = 0.34 är störst. 9.29 Ho förkastas på 5% signifikansnivå ty P(€ ::; 1 I Ho sann) = 0.01953 < 0.025. 9.30 Ho förkastas på 1% signifikansnivå ty
P(€ 2'. 11 I Ho sann)
=
0.00317
0.025. © Studentlitteratur
0.025.
9.34
a) 5 c) 10
b)7
9.35 Ho förkastas ej på 5% signifikansnivå ty
P( € ::; 2 I Ho sann)
0.144533
>
0.05.
9.36 Ho : ~ = 0 H1 : ~ < 0 Ho förkastas på 5% signifikansnivå ty
z
s/v'B < -to.05(7) där
a) Ho förkastas ej på 5% signifikansnivå ty
P(€::;
0.032713
< 0.05.
Zi
J~ I:(z; - z)
Yi -
X;
och
s
=
2.
9.37 Märkena skiljer sig åt på 5% signifikansnivå.
331
Svar
9.38 Ho kan inte förkastas på 5% signifikansnivå. 9.39
a) Ja, Ho förkastas på 5% signifikansnivå. b) Ja, Ho förkastas på 5 (och 0.1) procents signifikansnivå.
11.12
a) Ho : 6 = 0 H1 : 6 > 0 Test I: Förkasta Ho om z > 0.179 Test Il: Förkasta Ho om d > 6 b) Test I bör användas ty S(0.34) = 0.89 för test I medan S(0.34) = 0.74 för test Il. konfidensgrad
11.13 [-0.35, 0.67]. 95%.
11.1
a) Ho : µ = 0.90 H1 : µ > 0.90. Ho förkastas på 1% signifikansnivå ty x > 0.944, dvs motororganisationen kan påstå att den har rätt med 1% felrisk. b) S(l.00) = 0.998
11.14 Ho : p = 257 /100000 H1 : p > 257 /100000 Ho kan inte förkastas på 1% signifikansnivå ty P({ 2 5 I Ho sann)> 0.01 11.15
a) Förkasta Ho om 11.2 0.987
x-
11.3 0.08 11.4 n 2 31
s
11.6 9 ~~ 2
= 0.001
< -to.os(n1 +n2-2)
där
11.5 0.0685
a)
jj - 10 + ...!... n2
s ✓...!... n1
b)
9 2 ~8
= 0.31
2
=
(n1 - l)sf + (n2 - l)s~ n1 + n2 - 2
b) Ho kan ej förkastas på 5% signifikansnivå.
11. 7 [0, 4.38]. konfidensgrad 95% . 11.8
b) 0.99 5
= 0.951
11.9 Det finns ingen anledning att betvivla att det är slumptal enligt x 2 testet med 5% signifikansnivå.
11.16
a) N(µ,u/-./5) c) k = 1.96
b) 0.27%
d) 1 - ~(3 - ,,/5)
+ ~(-3 - -./5) = 0.22
= 0.6
11.10 0.19 eller 0.14 (utan halvkorrektion), 0.16 (med halvkorrektion).
11.17 k
11.11 0.03
a) P({(l) > x)
11.18 2)..e- 2 >.x,
b) c
=
X
>0
=
e -2>.x ,
J(x)
2
©
Studentlitteratur
332
11.30 [0.23, 2.56], konfidensgrad 95%
11.19
a) Al - B2, E(V) = 68 b) A2 - B3, P(V 2': 100) 11.21
= 0.76
i = 0.375
11.31
a:::,
1190
11.32
a) 1-e-½
= 0.12 b)
0.013
11.22
a) [-3.4, -0.5], eftersom intervallet inte innehåller O kan man med 99% säkerhet påstå att det är skillnad på volymsökningen vid normaldagar och omväxlingsdagar. 11.23
a) Ho kan inte förkastas på 1% signifikansnivå om man använder teckentestet ty P( { = 0 I Ho sann) > 0.005. b) minst 8
11.33
a) Ho : µ = 500 H1 : µ < 500 Ho kan förkastas på 5% signifikansnivå ty x < 491.78. TV-tillverkaren kan alltså underkänna partiet på 5% signifikansnivå. b) 0.91 11.34 Toras metod ty den ger den minsta standardavvikelsen a = 0.02. 11.35
a) 0.9702
b) 0.98604
11.24 Mellan 9.5 och 10 tidsenheter. 11.36 786
11.25
a) Om 0.0588 < x < 0.0612 så förkastas inte Ho och maskinen justeras inte. Om x < 0.0588 eller x > 0.0612 så förkastas Ho och maskinen justeras. Om x = 0.061 så kanHo inte förkastas på 5% signifikansnivå. b) S(0.059) = 0.37. 11.26 5.26 tidsenheter.
b) 0.889
11.28 [4.7, 6.4], konfidensgrad 99.5% . 11.29 [5.09, 6.06], konfidensgrad 99%
© Studentlitteratur
11.38
a) [6.648, 6.698], konfidensgrad 95% . b) Ett konfidensintervall har konfidensgrad 95% om det är konstruerat med en metod som med sannolikhet 0.95 ger ett korrekt på stående. 11.39 0.75
11.27
a) 0.89
11.37 [-7.9,44.9], konfidensgrad 95%
11.40
a) 0.21 c) 0.16 11.41
b) 0.39 d) 0.49 b) a
=½
333
Svar
11.42 P(~ 1,2,3, .... 11.43
= x) = p(l -
p)"'- 1 , x
=
b} 0.64
11.44 [1. 70, 2.36], konfidensgrad 99% 11.47
a)
11.49 a) Låt x;, y; och z;, i 1, 2, ... , 10, beteckna mätvärdena vid bestämningarna av M2, M2 respektive M3. Då är x;, y; och z; observerade värden från N(µ 1 + e, 0.3}, N(µ 2 + e, 0.3) respektive N(µ 3 + e, 0.3). Testa Ho : µ 3 - (µ 1 + 4µ 2 )/5 = 0 mot H1 : µ 3 - (µ 1 + 4µ 2 )/5 < 0. Förkasta Ho om -
z -
(:t+4ji)
s
+ .l. ( 0.09 + 16-0.09) 10. 25 10 10
< -.X.
✓ 0.09
där
på signifikansnivån o:. b} 0.56
b} [25.33, 27.37], konfidensgrad 90% .
11.50 0.1 11.51
11.48
a) F(x) = 1-e->.nx, .X.ne->.nx, X~ 0
X
~ 0, f(x)
=
a} µ:bs = 0.069, CT~bs = 0.099 b} [-0.024, 0.161], konfidensgrad 95%
b} F(x) = (1-e-.>.:r}n, x ~ 0, J(x) = .X.n(l-e>-xt- 1 e->-x, X~ 0
© Studentlitteratur
Index additionssatsen för mängder, 49 andra kvartil, 17 approximationer, 165 Bin(n,p) --+ Po(np), 86 Bin(n,p)--+ N(µ,u), 171 Hyp(N,n,p)--+ Bin(n,p), 85 Hyp(N,n,p)--+ N(µ,u), 171 Po(>.)--+ N(µ,u), 171 aritmetiskt medelvärde, 8
exponentialfördelningspapper, 270 fakultet, 44 felfortplantningslagarna, 151 felintensi tet, 121 frekvens, 11 frekvensfunktion, 106 frekvenstabell, 11 fördelningsfunktion, 78 fördelning binomial, 83 x 2 -fördelning, 221 diskret, 73 exponential, 113 hypergeometrisk, 82 likformig, 82 normal, 115 Poisson, 85 punktskattning introduktion, 180 rektangel, 111 Weibull, 115 fördelningsfunktion, 106 fördelningspapper, 267 första kvartil, 17
beskrivande statistik, 7 betingad sannolikhet definition, 57 introduktion, 55 binomialapproximation, 85 binomialfördelning, 83 binomialsannolikheter, 66 cauchyfördelning, 133 centrala gränsvärdessatsen, 168 introduktion, 165 x2 -fördelningen definition, 221 x 2 -test, 278 Fo fullständigt känd, 278 Fo ej fullständigt känd, 282 testvariabel, 279
Gauss approximationsformler en variabel, 149 introduktion, 148 två variabler, 151 Gaussfördelning, 115 goodness-of-fit x 2 -test, 278 Kolmogorov-Smirnov, 284 grupperat material, 11
direktmetoden, 254 diskret fördelning, 82 diskret stokastisk variabel, 74 diskret utfallsrum, 47 effektivitet, 183 enkel hypotes, 237 ensidigt konfidensintervall, 207 ensidigt test, 243 exponentialfördelningen, 113
halvkorrektion, 171 histogram, 16, 21
335
336 kumulativt, 16 hypergeometrisk fördelning, 82 hypotesprövning, 233 binomialfördelning, 254 enkel hypotes, 237 ensidigt test, 243 introduktion, 231 mothypotes, 234 nollhypotes, 234 signifikansnivå, 234 styrka, 235 styrkefunktion, 238 testvariabel, 234 tvåsidigt test, 243 via konfidensintervall, 251 händelse, 40 icke-parametriska metoder, 197, 225, 263 intervallskattning definition, 196 k element ur n, 44 klassindelat material, 14 klassisk sannolikhetsdefinition, 41 Kolmogorov-Smirnovs test, 284 Kolmogorovs axiom, 48 komplementsatsen för mängder, 49 konfidensgrad definition, 196 introduktion, 194 konfidensintervall, 195 definition, 196 förµ i N(µ, 17) 17 känt, 199 17 okänt, 202 för 17 2 och 17 i N(µ, 17), 220 introduktion, 193 stickprov i par ej N(µ, 17), 225 N(µ,17), 210 två stickprov, 212 Kontinuerliga stokastiska variabler definition, 106 frekvensfunktion, 106 fördelningsfunktion, 106 introduktion, 103 kontinuerligt utfallsrum, 47
©
Studentlitteratur
INDEX kumulativ relativ frekvens, 11 kumulativt histogram, 16, 21 kvartilavstånd, 17, 22 kvartilavvikelse, 17 likformig fördelning, 82 lägesmått median, 129 percentil, 131 väntevärde, 91, 121 medelvärde, 8, 21 median, 8, 16, 21 definition, 129 mothypotes, 234 multiplikationsprincipen, 43 multiplikationssatsen för mängder, 62 mätfel introduktion, 143 noggrannhet, 144 precision, 144 systematiska, 144 väntevärdesriktiga, 144 nollhypotes, 234 normalfördelning introduktion, 155 standardiserad, 155 summor av, 159 symmetriegenskap, 156 {, 162 normalfördelningen, 115 normalfördelningspapper, 274 oberoende händelser definition, 62 introduktion, 62 stokastiska variabler definition, 135, 136 observerad punktskattning, 178 observerat stickprov, 178 observerat värde, 73 ordnat stickprov, 277 percentil, 131 Poissonapproximation, 86 Poissonfördelning, 85
337
INDEX poolad varians, 214 punktskattningar effektivitet, 183 introduktion, 177 observerad, 178 s-metoden, 185 standardavvikelse, 185 varians, 185 variationsbredd, 185 väntevärde, 185 väntevärdesriktighet, 181
testvariabel, 234 Tjebysjevs olikhet, 24 trappstegskurva, 12, 21 tredje kvartil, 17 två stickprov förutsättningar, 216 konfidensintervall, 212 tvåsidigt test, 243 typvärde, 13, 16, 21
R-metod, 186 rektangelfördelning, 111 rektangelfördelningspapper, 267
varians, 9, 22 binomialfördelning, 100 definition, 98, 126 hypergeometrisk fördelning, 100 introduktion, 97, 125 normalfördelning, 127 Poissonfördelning, 100 variationsbredd, 9, 17, 22 väntevärde definition, 92, 122 fördelning exponential, 123 normal, 124 introduktion, 91, 121 väntevärdesriktighet, 181
s-metoden, 185 sammansatt hypotes, 237 sannolikhetsfunktion, 78 sannolikhetsmassa, 48 sannolikhetsmått, 48 slumpmodell, 75 slumpmässig modell, 3 slumpmässigt försök, 39 slumpvariabel, 73 spridningsmått kvartilavstånd, 17 kvartilavvikelse, 17 standardavvikelse, 9, 97, 125 varians, 9 variationsbredd, 9 standardavvikelse, 9, 22 definition, 98, 126 introduktion, 97, 125 normalfördelning, 127 stickprov i par förutsättningar, 216 konfidensintervall, 210 stokastisk modell, 3, 75 stokastisk variabel, 73 stolpdiagram, 21 styrkefunktion, 238
utfallsrum, 40
Weibullfördelning, 115 Wilcoxons rangsummetest, 263
t-fördelning, 203 t-test, 246 teckenintervall, 197 teckentest, 258 testets styrka, 235 ©
Studentlitteratur