246 17 8MB
Portuguese Pages 166 [169] Year 2011
ISBN 978-85-64124-07-3
9 788564 124073
Presidência da República Federativa do Brasil Ministério da Educação 6HFUHWDULDGH(GXFDomR3URÀVVLRQDOH7HFQROyJLFD Instituto Federal de Brasília
6HFUHWDULDGH(GXFDomR3URÀVVLRQDOH7HFQROyJLFD6HWHF /XL]$XJXVWR&DOGDV3HUHLUD ([ 'LUHWRU GD 'LUHWRULD GH )RUPXODomR GH 3ROtWLFDV GD (GXFDomR 3URÀVVLRQDO H 7HFQROyJLFD 0DULkQJHODGH$UDXMR3yYRDV3HUHLUD $VVHVVRUD GD 'LUHWRULD GH )RUPXODomR GH 3ROtWLFDV GD (GXFDomR 3URÀVVLRQDO H 7HFQROyJLFD Viviani Pereira A. Guimarães (VSHFLDOLVWD HP *HVWmR H 3ODQHMDPHQWR (GXFDFLRQDO 7KDLV6LOYD$OPHLGD $JHQWH $GPLQLVWUDWLYR )OiYLD&DHWDQR 7pFQLFD HP $VVXQWRV (GXFDFLRQDLV
6pULH 1RYRV $XWRUHV GD (GXFDomR 3URÀVVLRQDO H 7HFQROyJLFD
Magno Alves de Oliveira
Probabilidade e estatística: um curso introdutório
Brasília-DF 2011
$YDOLDGRUHV GD 6pULH ´1RYRV $XWRUHV GD (GXFDomR 3URÀVVLRQDO H 7HFQROyJLFDµ Fabiano Oliveira Antonini )iWLPD/XFtOLD9LGDO5RGULJXHV )UDQFLVFRGH$VVLV3yYRDV3HUHLUD *OyULD0DULQKR Lilian Páscoa 0DUFR$QW{QLR%RWHOKR6RDUHV 0{QLFD%UDJD0DUoDO 1HOPD0LULP&KDJDVGH$UD~MR 2WiYLR)HUQDQGHV/LPDGD5RFKD 3DWUtFLD6LOYD6DQWLDJR Paulo Maria Ferreira Robson Bastos Roen 5RJpULR-RVp&kPDUD Rossana Barros Silveira
&RQVHOKR (GLWRULDO Edilsa Rosa da Silva Elisa Raquel Gomes de Sousa -RVXpGH6RXVD0HQGHV Paulo Henrique de Azevedo Leão 3KLOLSSH7VKLPDQJD.DEXWDNDSXD 9HUXVND5LEHLUR0DFKDGR 3UHVLGHQWH GR &RQVHOKR (GLWRULDO Paulo Henrique de Azevedo Leão 6HFUHWiULD ([HFXWLYD 9HUXVND5LEHLUR0DFKDGR &RRUGHQDGRU GH 3XEOLFDo}HV Paulo Henrique de Azevedo Leão Editores Paulo Henrique de Azevedo Leão e6DQGUD0DULD%UDQFKLQH 3roMeto JriÀFo e FDSD 0DUFRV+DUWZLFK Assessoria editorial -DLU6DQWDQD0RUDHV 'iaJraPaomo 5DSKDHO&DURQ)UHLWDV 7iraJeP 2.000 exemplares 2 liYro 3roEaEilidade e estattstiFa XP FXrso iQtrodXtyrio p XPa SXEliFaomo da Editora ,)% e FoPS}e a sprie ´1oYos AXtores da EdXFaomo 3roÀssioQal e 7eFQolyJiFaµ da 6eFretaria de EdXFaomo 3roÀssioQal e 7eFQolyJiFa 6eteF do 0iQistprio da EdXFaomo 'ados iQterQaFioQais de &ataloJaomo Qa 3XEliFaomo &,3 O48p
OliYeira 0aJQo AlYes de 3roEaEilidade e estattstiFa XP FXrso iQtrodXtyrio 0aJQo AlYes de OliYeira ² %rastlia Editora ,)% p il 4 FP ² 6prie 1oYos AXtores da EdXFaomo 3roÀssioQal e 7eFQolyJiFa ,6%1 8844 ,QFlXi EiElioJraÀa 3roEaEilidade EstattstiFa , 7ttXlo &'8
Agradecimentos
Agradeço o incentivo da professora Ivone Moreyra e dedico este trabalho aos estudantes do Campus Planaltina do Instituto Federal de Brasília (IFB), onde tudo começou.
Sumário
Apresentação da Setec/MEC 11 Introdução 13 CAPÍTULO I 17 UMA INTRODUÇÃO À TEORIA DE CONJUNTOS 19 1. O conjunto das partes de um conjunto 19 2. Operações com conjuntos 25 3. Conjuntos numéricos 28 3.1. Uma interpretação para frações 28 3.2. Dízimas periódicas 31 3.3. Proporcionalidade 33 3.4. Regra de três 37 Exercícios 41 CAPÍTULO II 55 NOÇÕES DE CONTAGEM 57 1. Os princípios fundamentais da contagem 58
8
2. Contando elementos no conjunto das partes de um conjunto com cardinalidade Ànita 65 3. Números combinatórios 69 Exercícios 73 CAPÍTULO III 77 ANÁLISE EXPLORATÓRIA DE DADOS 79 1. Medidas resumo 80 1.1. Medidas de posição 80 1.2. Medidas de dispersão 85 2. GriÀcos 91 Exercícios 96 CAPÍTULO IV 103 ESTATÍSTICA DESCRITIVA 105 1. Conceitos básicos 106 2. Amostragem 109 2.1. Técnicas de amostragem 110 3. Aleatoriedade 114 3.1. Noção intuitiva de variável aleatória 114 4. Técnicas da Estatística descritiva 116 4.1. Análise da frequência 116 4.2. GráÀcos 120 4.3. Histogramas e distribuição da frequência 122 4.4. Outros tipos de gráÀcos 125 5. Resumo das etapas do trabalho estatístico 129 Exercícios 131 CAPÍTULO V 135 NOÇÕES DE PROBABILIDADE 137 1. Alguns conceitos básicos 138 2. Medidas de probabilidade 139 2.1. O método clássico 140 2.2. O método frequentista 141 2.3. O método bayesiano 142 2.4. DeÀnição de probabilidade 142 3. Propriedades operatórias 145 3.1. Monotonicidade da probabilidade 145
Probabilidade e Estatística: um curso introdutório
3.2. Probabilidade de não ocorrência de um evento 145 3.3. Probabilidade da união qualquer de eventos 147 4. Probabilidade conjunta e dependência 149 4.1. Dependência 150 4.2. Probabilidade condicional 151 4.3. Teorema de Bayes 154 Exercícios 156 REFERÊNCIAS BIBLIOGRÁFICAS 163
9
Apresentação da Setec/MEC
$ VpULH GH SXEOLFDo}HV ´1RYRV $XWRUHV GD (GXFDomR 3URÀVVLRQDO H Tecnológica” é parte de um conjunto extenso de ações encaminhadas pela 6HFUHWDULD GH (GXFDomR 3URÀVVLRQDO H 7HFQROyJLFD 6HWHF0(& TXH GHPDUFDP XP SHUtRGR GH YDORUL]DomR GD (GXFDomR 3URÀVVLRQDO H 7HFQROyJLFD (37 $ FRQFHSomRGDVDWXDLVSROtWLFDVDÀUPDVHQDGHIHVDGHXPD(37TXHQmRHQFHUUH RVHQWLGRGHTXDOLÀFDomRSDUDRWUDEDOKRQROLPLWHGRTXHpDDWLYLGDGHPDVVLP GRTXHVHGHYHH[SOLFDUSHODVVXDVÀQDOLGDGHVHSHORVVHXVYDORUHVRXVHMDQmR QRTXHVHFLUFXQVFUHYHDRWpFQLFRPDVVLPjH[LVWrQFLDKXPDQDHjYLGD $H[WHQVmRHDGLYHUVLGDGHGDVPHGLGDVHPFXUVRTXHVHFDUDFWHUL]DPSRU VXDQDWXUH]DVLVWrPLFDVmRUHYHODGRUDVGDIDFHGHOLEHUDGDGHXPDSROtWLFDTXH YLVDVXSHUDUDFRPSUHHQVmRUHGXFLRQLVWDHIUDJPHQWDGDGH(GXFDomR3URÀVVLRQDO H7HFQROyJLFDHPSUROGHXPDYLVmRHPTXHSDUWHHWRGRVmRLQVHSDUiYHLV1HVVH VHQWLGRpIXQGDPHQWDOREVHUYDUTXHDH[SDQVmRGDRIHUWDFRPDFULDomRGHQRYDV unidades públicas (Expansão das Redes Federal e Estaduais), e o estabelecimento de novos referenciais legais, normativos e pedagógicos só se FRQÀJXUDUmRHP
12
Probabilidade e Estatística: um curso introdutório
REMHWLYRVYHUGDGHLUDPHQWHDOFDQoDGRVTXDQGRRQH[RFRPDSUiWLFDGRFHQWHH D´VDODGHDXODµWUDGX]LUVHHPXPDTXDOLÀFDomRSDUDRWUDEDOKRSDXWDGDSHOR compromisso com a formação integral e cidadã. 'HVVHPRGRpLPSRUWDQWHTXHRVSURFHVVRVGHIRUPDomRSDUDRH[HUFtFLR GH SURÀVV}HV WpFQLFDV H WHFQROyJLFDV QmR DGRWHP DERUGDJHQV TXH GHVFROHP RV ´FRQKHFLPHQWRV HVSHFtÀFRVµ GH VHXV IXQGDPHQWRV FLHQWtÀFRV H WHyULFRV H QmR GHVFRQWH[WXDOL]HP RV VDEHUHV DSOLFDGRV DR WUDEDOKR QHJDQGROKHV RV determinantes sociais e humanos associados a sua produção, sob pena de uma formação meramente funcionalista e instrumentalizadora. Assim, nesse contexto – apesar do desenvolvimento das novas tecnologias e de textos digitais, e das FRQWUDGLo}HVHGRVGHEDWHVTXHRFHUFDP²pSUHFLSLWDGRQHJDUDLPSRUWkQFLD GR OLYUR FRPR VXSRUWH SDUD R GHVHQYROYLPHQWR GRV SURFHVVRV GH HQVLQR DSUHQGL]DJHPVHPFRQWXGRQHJDUDVDOWHUQDWLYDVGHTXHRSURIHVVRUGLVS}H SDUDRH[HUFtFLRGDDXWRQRPLDHGDOLEHUGDGHQRH[HUFtFLRGDGRFrQFLD 3RUÀPDVpULH´1RYRV$XWRUHVGD(GXFDomR3URÀVVLRQDOH7HFQROyJLFD” FRQWHPSOD HQWUH VHXV REMHWLYRV D SUHRFXSDomR GD 6HWHF0(& HP LQYHQWDULDU e democratizar a reconhecida produção de material destinado ao conteúdo HVSHFtÀFR GRV FXUVRV GH IRUPDomR SURÀVVLRQDO SURGX]LGRV SRU SURIHVVRUHV GD 5HGH)HGHUDOGH(GXFDomR3URÀVVLRQDO&LHQWtÀFDH7HFQROyJLFD Desejo aos professores e alunos proveitoso uso desta publicação.
Eliezer Moreira Pacheco 6HFUHWiULRGD6HWHF0(&
Introdução
)HQ{PHQRVLPSRUWDQWHVUHODFLRQDGRVjVGLQkPLFDVWHFW{QLFDHFOLPiWLFD do planeta Terra voltaram a ocupar lugar central na preocupação da população PXQGLDO3DUDFLWDUGRLVGHOHVRWHUUHPRWRTXHDVVRORXR+DLWLHPMDQHLURGH HRVUHFHQWHVUHFRUGHVSOXYLRPpWULFRVTXHDVVRPEUDUDPDSRSXODomREUDVLOHLUD no verão do mesmo ano. Além das perdas humanas, esses acontecimentos trazem enormes perdas materiais, seja na estrutura das cidades ou na produção DJURSHFXiULD Fenômenos como esses, ou como o sobe e desce das bolsas de valores, TXHIXQFLRQDPFRPRWHUP{PHWURVGDHFRQRPLDJOREDOID]HPFUHVFHURSDSHO GDPDWHPiWLFDFRPRGLVFLSOLQDDFDGrPLFDHVREUHWXGRYrPUHVVLJQLÀFiOD,VVR SRUTXHpHYLGHQWHTXHDVRFLHGDGHSUHFLVDDSULPRUDURVVHXVPpWRGRVGHSUHYLVmR de fenômenos tão importantes, para tentar minorar os seus impactos e, nesse DVSHFWR D PDWHPiWLFD p XPD LPSRUWDQWH IHUUDPHQWD SDUD R GHVHQYROYLPHQWR FLHQWtÀFRHWHFQROyJLFRHRVHXGHVHQYROYLPHQWRLPSOLFDRGHVHQYROYLPHQWRGD FLrQFLDHGDWHFQRORJLDFRPRXPWRGR
14
Probabilidade e Estatística: um curso introdutório
7RGDYLD R FDUiWHU DOHDWyULR GH IHQ{PHQRV FRPR HVVHV H[LJH R GHVHQYROYLPHQWRHRDSURIXQGDPHQWRHPiUHDVGDPDWHPiWLFDTXHVHGHGLFDP ao estudo de padrões de comportamento, registros, armazenamento e SURFHVVDPHQWRGHLQIRUPDo}HVHGHFiOFXORVGHSUREDELOLGDGHV $VRFLHGDGHMiSRVVXLXPFRQKHFLPHQWRDFXPXODGRFRQVLGHUiYHOHQRYDV WHRULDVWpFQLFDVHWHFQRORJLDVWrPVLGRGHVHQYROYLGDVFRQWLQXDPHQWHeSUHFLVR JDUDQWLURFUHVFLPHQWRGHVVHFRQKHFLPHQWRDOpPGDVXDVXVWHQWDomRSDUDTXH SRVVDPRV REWHU SUHYLV}HV FDGD YH] PDLV UD]RiYHLV H VHMDPRV FDSD]HV GH QRV previnir contra possíveis danos. &RPYLVWDVDHVVHIXWXURUHXQLPRVQHVWHOLYURWH[WRLQIRUPDo}HVHVVHQFLDLV SDUD TXH R HVWXGDQWH Gr RV SULPHLURV SDVVRV QR HVWXGR GD PDWHPiWLFD HP HVSHFLDOQRTXHGL]UHVSHLWRjSUREDELOLGDGHHjHVWDWtVWLFD Ao longo deste trabalho, alguns conceitos serão tratados de forma bem LQWXLWLYDVHPWUDWDPHQWRPDWHPiWLFRIRUPDO/HPEUDPRVTXHRSULQFLSDOREMHWLYR GHVWH OLYURWH[WR p IDPLOLDUL]DU R OHLWRU FRP DOJXQV DVSHFWRV LPSRUWDQWHV TXH IXQGDPHQWDPRHVWXGRGDHVWDWtVWLFDHGDSUREDELOLGDGHHTXHPXLWDVYH]HVVmR WUDWDGRVGHIRUPDUDVDQDHGXFDomREiVLFD&RPRFRQVHTXrQFLDGHVVHWUDWDPHQWR VXUJHPHQWUDYHVTXHLPSHGHPDFRPSUHHQVmRGHFRQFHLWRVPDLVUREXVWRV (PQHJULWRHQFRQWUDPVHGHVWDFDGRVRVWHUPRVTXHSRVVXHPVLJQLÀFDGR PDWHPiWLFR SUHFLVR 2 IRUPDOLVPR GR VLJQLÀFDGR GH PXLWRV GHVVHV WHUPRV QmRVHUiWUDWDGRDTXLPDVVHPSUHVHUiDSUHVHQWDGDXPDLGpLDLQWXLWLYDSDUDR OHLWRU7RGDYLDHVVDLPSUHFLVmRQmRGHYHFRPSURPHWHUDOHLWXUD$RFRQWUiULR SUHWHQGHDPSOLDUDFDSDFLGDGHGROHLWRUGHVLWXDURVREMHWRVDTXLHVWXGDGRVQD teoria aprendida no Ensino Médio, além de preparar o terreno para estudos mais aprofundados em estatística e probabilidade. 1R&DStWXORDSUHVHQWDPRVXPDGLVFXVVmRVREUHFRQMXQWRVHDVSULQFLSDLV UHODo}HV TXH HOHV WUDYDP HQWUH VL &RPR H[HPSOR LQWURGX]LPRV R FRQMXQWR GRV números reais e damos atenção especial ao conjunto dos números racionais. 1R&DStWXORRFXSDPRQRVGDWDUHIDGHFRQWDURQ~PHURGHHOHPHQWRV GH DOJXQV FRQMXQWRV (VVD WDUHID QmR p WmR VLPSOHV XPD YH] TXH HQYROYH D KDELOLGDGHGHFODVVLÀFDomR
Probabilidade e Estatística: um curso introdutório
No Capítulo 3, associamos aos conjuntos diversas medidas descritoras do comportamento dos seus elementos. Essas medidas servem de critério para a comparação de conjuntos distintos. Em particular, introduzimos o conceito de JUiÀFR como uma dessas medidas. No Capítulo 4, discutimos sobre a aleatoriedade e apresentamos a (VWDWtVWLFD FRPR D FLrQFLD TXH WUDWD GRV IHQ{PHQRV DOHDWyULRV 7pFQLFDV GR trabalho estatístico são apresentadas, desde os cuidados para se efetuar uma coleta de dados até a comunicação dessas informações, devidamente tratadas. 1R &DStWXOR DSUHVHQWDPRV XP WLSR GH PHGLGD TXH GH DOJXPD PDQHLUDTXDQWLÀFDDLQFHUWH]DLQHUHQWHDRVIHQ{PHQRVDOHDWyULRVDPHGLGDGH SUREDELOLGDGH'LVFXWLPRVVXDGHÀQLomRIRUPDOVXDVSULQFLSDLVSURSULHGDGHVH DOJXQVWHRUHPDVTXHQRVDMXGDUmRDUHVROYHUDOJXQVSUREOHPDVUHFRUUHQWHVGR cotidiano. $RÀQDOGHFDGDFDStWXORVHOHFLRQDPRVDOJXQVSUREOHPDVFRPJUDXVGH GLÀFXOGDGHYDULDGRVUHODFLRQDGRVjWHRULDDOLGLVFXWLGD0XLWRVGHVVHVH[HUFtFLRV apareceram em processos seletivos ou concursos públicos recentes de alguns institutos federais. $R HODERUDU HVWH OLYURWH[WR QRVVD SUHRFXSDomR IRL IXQGDPHQWDU RV conceitos de estatística e probabilidade HP JHUDO YLVWRV GH IRUPD VXSHUÀFLDO H GHVFRODGD GRV GHPDLV FRQWH~GRV QR (QVLQR 0pGLR DGDSWDQGRRV D XPD linguagem mais objetiva, própria para discussões em cursos de nível técnico ou tecnológico. 5HVVDOWDPRV R FDUiWHU LQWURGXWyULR GHVVDV LGHLDV H HVSHUDPRV TXH D OLQJXDJHP XWLOL]DGD VHMD OLEHUWDGRUD R VXÀFLHQWH SDUD TXH R OHLWRU RXVH DOoDU novos voos por essa teoria.
15
CAPÍTULO I UMA INTRODUÇÃO À TEORIA DE CONJUNTOS
Uma introdução à teoria de conjuntos
1 Uma introdução à teoria de conjuntos 8PDQRomRIXQGDPHQWDOSDUDRHVWXGRTXHGHVHQYROYHUHPRVDRORQJR deste trabalho é a noção de FRQMXQWR. Na verdade, é impossível desenvolver a LGHLDGRTXHpXPFRQMXQWRGLVVRFLDGDGDTXHODGRTXHpelemento. Chamamos GH FRQMXQWR D TXDOTXHU FROHomR GH REMHWRV FRLVDV RX VHUHV DLQGD TXH YD]LD Cada um desses objetos, coisas ou seres é um elemento do conjunto. Dois conjuntos serão LJXDLV se possuírem exatamente os mesmos HOHPHQWRV H VHUmR GLVWLQWRV VH GLIHULUHP XP GR RXWUR SHOD TXDQWLGDGH GH HOHPHQWRV RX SHOD SUHVHQoD GH SHOR PHQRV XP HOHPHQWR QXP GHOHV TXH GLIHUH GH WRGRV RV HOHPHQWRV GR RXWUR (VVH FRQFHLWR VHUi IRUPDOL]DGR PDLV adiante.
20
Capítulo I - Uma introdução à teoria de conjuntos
1RWH TXH DWp PHVPR SUD IDODU GH FRQMXQWR YD]LR precisamos falar de HOHPHQWRRXPHOKRUGDVXDDXVrQFLD4XDQGRXPFRQMXQWRpYD]LRFRVWXPDPRV UHSUHVHQWiORFRPRØ ou {}. 5HSUHVHQWDUHPRV XP FRQMXQWR TXDOTXHU RUD SRU OHWUDV PDL~VFXODV GR alfabeto (A, B, C, ...) ou por letras maiúsculas do alfabeto grego (*ƺ ¨ , RUD OLVWDQGR VHXV HOHPHQWRV TXDQGR LVVR IRU SRVVtYHO RUD SRU XPD GHVFULomR LQHTXtYRFD GH VHXV HOHPHQWRV RX VLPSOHVPHQWH SRU PHLR GH XP HVTXHPD SLFWRJUiÀFR-iRVHOHPHQWRVVHUmRUHSUHVHQWDGRVSRUOHWUDVPLQ~VFXODVGRQRVVR DOIDEHWRDEF VHPSUHTXHQHFHVViULR Exemplo 1.1. A expressão ^` representa o FRQMXQWRGRVQ~PHURVQDWXUDLV2XWUDVPDQHLUDVGHUHSUHVHQWDUHVVH conjunto são N ou {xxpXPQ~PHURQDWXUDO` Exemplo 1.2. O conjunto Z {²²²` representa o FRQMXQWRGRVQ~PHURVLQWHLURV. Exemplo 1.3. O conjunto Q {x m; m ZHnZ ` n representa o FRQMXQWRGRVQ~PHURVUDFLRQDLV. Cada elemento x de Q é dito ser uma fração, e toda fração admite uma representação decimal, resultado da divisão do seu numerador pelo seu denominador. Por exemplo,
2VtPEROR VREUHVFULWRDRFRQMXQWRZVLJQLÀFDTXHHVWDPRVH[FOXLQGRR]HURGRFRQMXQWRRXVHMD Z {+++`,VVRpGHYLGRDRIDWRGHQmRVHGHÀQLUIUDo}HVFRPGHQRPLQDGRUQXOR
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
1 (UHSUHVHQWDomRGHFLPDOLQÀQLWD 2
e
1 (dízima periódica
Exemplo 1.4. Chamamos de FRQMXQWR GRV Q~PHURV UHDLV e denotamos por R o conjunto dos números que possuem representação decimal finita ou infinita. Observe que, pelo exposto no Exemplo 1.3, todo número racional é um número real. No entanto, existem números com representação decimal infinita que não admitem representação na forma de fração. É o caso, por exemplo, do número 0,30300300030000... . Números como esse também são chamados de Gt]LPDVQmRSHULyGLFDV ou números irracionais. Se um conjunto A possui um elemento, digamos aHQWmRGL]HPRVTXHa pertence a A e denotamos essa condição por a A.
4XDQGRXPHOHPHQWRTXDOTXHUb não faz parte da coleção A, dizemos TXHb não pertence a A, e denotamos essa condição por b A.
$V UHODo}HV H VmR FKDPDGDV GH relações de pertinência, pois GL]HPUHVSHLWRjSRVLomRUHODWLYDHQWUHXPHOHPHQWRHXPFRQMXQWR Podemos, também, considerar a posição relativa entre dois conjuntos TXDLVTXHU3DUDLVVRLQWURGX]LPRVDQRomRGHVXEFRQMXQWR.
([LVWHPPDLVQ~PHURVLUUDFLRQDLVGRTXHUDFLRQDLV3DUDVHFRQYHQFHUGLVVRSDUDFDGDQ~PHURUDFLRQDO existente, podemos gerar mais de um número irracional correspondente. Por exemplo, para o número UDFLRQDOSRGHPRVJHUDURVQ~PHURVLUUDFLRQDLVH HSDUDRQ~PHURUDFLRQDOSRGHPRVJHUDUH
Série Novos Autores da Educação Profissional e Tecnológica
21
22
Capítulo I - Uma introdução à teoria de conjuntos
'HÀQLomR'DGRVGRLVFRQMXQWRV$H%GL]HPRVTXH$pVXEFRQMXQWR de B, se todo elemento de A é também elemento de B. Denotamos essa condição DVVLPA B. Mais formalmente,3SRGHPRVUHHVFUHYHUD'HÀQLomRDVVLP A B aA a B.
A expressão A BSRGHVHUOLGDGHWUrVPDQHLUDVGLVWLQWDVA é parte de B ou A está contido em B'HTXDOTXHUPDQHLUDRVHXVLJQLÀFDGRSUHFLVRHVWi descrito pela sentença lógica (3). ([SORUDQGRXPSRXFRPDLVD'HÀQLomRSRGHPRVFRQFOXLUTXHSDUD TXHXPFRQMXQWRA não seja um subconjunto de um conjunto BEDVWDTXHHOH SRVVXDXPHOHPHQWRTXHQmRSHUWHQoDDB'HQRWDUHPRVHVWDVLWXDomRDVVLP A B.
3RGHPRV HQWmR FRQFOXLU TXH R FRQMXQWR YD]LR p VXEFRQMXQWR GH TXDOTXHU4 conjunto, isto é, ØA, FRQMXQWRA $V UHODo}HV H TXH GHÀQHP DV SRVLo}HV UHODWLYDV HQWUH GRLV FRQMXQWRVTXDLVTXHUVmRWDPEpPFKDPDGDVGHrelações de inclusão. Neste ponto, podemos formalizar o conceito de LJXDOGDGHGHFRQMXQWRV 'HÀQLomR Dados dois conjuntos A e B GL]HPRV TXH A = B se, e somente se, A B e B A. 3HODGHÀQLomRDFLPDpIiFLOSHUFHEHUTXH{1,2` {2,1` {1,1,1,2,2`. Fica FODUR WDPEpP TXH D WHUPLQRORJLD TXH HVWDPRV XVDQGR SDUD FRQMXQWRV YLVD representar a variedade da informação presente em uma coleção.
Proposições lógicas do tipo “p qµSRGHPVHUOLGDVDVVLPVHp então q , ou ainda , p implica q-i proposições do tipo “p q” podem ser lidas como p se, e somente se, q, ou ainda, p é equivalente a qHVLJQLÀFDPTXHp q e q p
3
4
2VtPERORSRGHVHUOLGRDVVLPpara todo ou qualquer que seja.
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
Exemplo 1.5. Considere o conjunto B {1,{1,2`,`. 1RWH TXH B p XPD FROHomR GH HOHPHQWRV (P SDUWLFXODU WHPRV TXH {1,2` B. No entanto, {1,2` BMiTXH2 B. 'HYROWDDRVH[HPSORVHFRQFOXLPRVTXHN Z Q R.
1.1 O conjunto das partes de um conjunto 'DGR XP FRQMXQWR TXDOTXHU B YLPRV TXH HOH DGPLWH SHOR PHQRV XP VXEFRQMXQWRTXHpRFRQMXQWRYD]LR6HVXEVWLWXLUPRVAQD'HÀQLomRSHOR próprio BFRQFOXtPRVTXHB B. Assim, o conjunto vazio e o próprio conjunto B são subconjuntos de B, também referidos como sendo os seus VXEFRQMXQWRV triviais. Um conjunto pode admitir VXEFRQMXQWRV QmR WULYLDLV (ou próprios). Por exemplo, considere os conjuntos C {HVWXGDQWHVGR,)%` e D {HVWXGDQWHVGRFXUVR7HFQyORJRHP$JURHFRORJLDGR,)%` 7HPRV TXH D Ø e D C. Como D C WHPRV TXH D é um subconjunto próprio de C. 9ROWHPRV DR FRQMXQWR DUELWUiULR B e pensemos em todos os seus subconjuntos. À coleção de todos esses objetos damos o nome de &RQMXQWRGDV partes de BTXHGHQRWDUHPRVSRU(B ou 2B. Exemplo 1.6. Considere o conjunto E {1,2`. Então (E {Ø,{1`,{2`,{1,2``
Série Novos Autores da Educação Profissional e Tecnológica
23
24
Capítulo I - Uma introdução à teoria de conjuntos
1R~OWLPRH[HPSORYHPRVTXHRFRQMXQWRESRVVXLHOHPHQWRVHQTXDQWR o conjunto (E SRVVXLHOHPHQWRVTXDQWLGDGHGHHOHPHQWRVGHXPGDGR conjunto B damos o nome de cardinalidade H QHVWH WUDEDOKR VHUi GHQRWDGD DVVLP#B'HYROWDDR([HPSORWHPRVTXH#E 2 e #(E . 1HVWH PRPHQWR SRGHPRV REVHUYDU TXH H[LVWHP FRQMXQWRV FRP FDUGLQDOLGDGH LQÀQLWD LVWR p FRQMXQWRV FRP XPD TXDQWLGDGH LQÀQLWD GH HOHPHQWRV9ROWHDRVH[HPSORVHHQRWHTXH#N e #Q . Isso não VLJQLÀFDTXHN e QWHQKDPDPHVPDTXDQWLGDGHGHHOHPHQWRV'HIDWRpIiFLO REVHUYDUTXHN QHTXHQPDVNRTXHPRVWUDTXHH[LVWHPPDLV Q~PHURVUDFLRQDLVGRTXHQDWXUDLV $FDUGLQDOLGDGHGHXPFRQMXQWRpTXHRGHÀQHFRPRXPFRQMXQWRÀQLWR ou como um FRQMXQWRLQÀQLWR. Exemplo 1.7. O intervalo limitado real I (,1@, isto é, o conjunto de todos os números reais maiores do que 0 e menores ou iguais a 1 é um conjunto infinito. 1RH[HPSORDQWHULRUDSUHVHQWDPRVRTXHFKDPDPRVGHLQWHUYDOROLPLWDGR UHDOTXHVmRVXEFRQMXQWRVGRFRQMXQWRGRVQ~PHURVUHDLVR,TXHDSUHVHQWDP um dos seguintes formatos (a, b {xRaxb`, [a, b {xRaxb`, (a, b@ {xRaxb` ou [a, b@ {xRaxb`. 'DGR XP LQWHUYDOR OLPLWDGR UHDO SRGHPRV LPDJLQDU LQÀQLWRV Q~PHURV TXHVDWLVIDoDPDUHODomRTXHRGHÀQH1RHQWDQWRGLIHUHQWHPHQWHGRFDVRGH N, o conjunto dos números naturais, não podemos listar os seus elementos. Em outras palavras, podemos entender o conjunto N como uma lista ordenada GH Q~PHURV UD]mR SHOD TXDO GL]HPRV TXH WRGR FRQMXQWR TXH DSUHVHQWD HVVD
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
característica é enumerável3HQVHXPSRXFRHYHMDTXHRFRQMXQWRI do Exemplo pnão enumerável, isto é, não apresenta essa característica. 8P LQWHUYDOR UHDO SRGH QmR VHU OLPLWDGR 1HVVH FDVR D UHODomR TXH R GHÀQHDVVXPHXPGRVIRUPDWRVDEDL[R (a, {xRx!a`, (²,b {xRxb`, [a, {xRxa` ou (²,b@ {xRxb` Podemos representar R (², e {a` [a, a@ como casos degenerados da caracterização acima. Além disso, Ø (a, a ,(a, a@RX[a, a . 2EYLDPHQWHVHXPFRQMXQWRBpLQÀQLWRHQWmRRFRQMXQWR(B também R VHUi &RPR YHUHPRV QR &DStWXOR D UD]mR GH XVDUPRV D QRWDomR B para UHSUHVHQWDURFRQMXQWRGDVSDUWHVGRFRQMXQWR%pSRUTXHTXDQGR#BpÀQLWD então #(B 2#B. 5HH[DPLQDQGRDVLWXDomRSURSRVWDQR([HPSORYHPRVTXH #(E 22 2#E.
2 Operações com conjuntos 'DGRVFRQMXQWRVTXDLVTXHUSRGHPRVGHÀQLUVREUHHOHVGLYHUVDVRSHUDo}HV As mais usuais são união, interseção, diferença e produto cartesiano. $QWHVGHSDUWLUSDUDDVGHÀQLo}HVSURSULDPHQWHGLWDVFRQYpPHVFODUHFHU RVLJQLÀFDGRGHGRLVLPSRUWDQWHVFRQHFWLYRVOyJLFRVRHGHQRWDGRSRU) e o ou (denotado por ).
Série Novos Autores da Educação Profissional e Tecnológica
25
26
Capítulo I - Uma introdução à teoria de conjuntos
2 FRQHFWLYR UHPHWH j VLPXOWDQHLGDGH 3RU H[HPSOR GL]HPRV ´HVVD propriedade possui rebanhos bovino e suíno”, Para informar a presença das duas HVSpFLHV GH UHEDQKR QD SURSULHGDGH VLPXOWDQHDPHQWH e EHP GLIHUHQWH GL]HU ´HVVDSURSULHGDGHSRVVXLUHEDQKRERYLQRRXVXtQRµSURSRVLomRTXHLQIRUPDQD verdade, a presença de, pelo menos, um dos tipos de rebanho. (PRXWURVWHUPRVFRQVLGHUHDVSURSRVLo}HV pHVVDSURSULHGDGHSRVVXLUHEDQKRERYLQR e qHVVDSURSULHGDGHSRVVXLUHEDQKRERYLQR As proposições compostas p q e p q representam, respectivamente, as GXDVIUDVHVGRH[HPSORGRSDUiJUDIRDQWHULRU2FRQHFWLYRGL]TXHDPEDVDV proposições p e qWrPYDORUOyJLFRYHUGDGHLURHQTXDQWRRFRQHFWLYR garante TXHSHORPHQRVXPDGDVSURSRVLo}HVp e q tem valor lógico verdadeiro. &RPSUHHQGLGR R VLJQLÀFDGR H[DWR GHVVHV FRQHFWLYRV HVWDPRV DSWRV D GHÀQLUDVSULQFLSDLVRSHUDo}HVSDUDFRQMXQWRV 'HÀQLomR Dados dois conjuntos, A e BGL]HPRVTXHDLQWHUVHomRGH A e B, denotada por A B, é o conjunto A B {xxAxB` 'HÀQLomR Dados dois conjuntos, A e BGL]HPRVTXHDXQLmRGHA e B, denotada por A B, é o conjunto AB {xxAxB`. 'HÀQLomR Dados dois conjuntos, A e BGL]HPRVTXHDGLIHUHQoDHQWUH A e B, denotada por A – B, é o conjunto A²B {xxAxB`
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
Exemplo 1.8. Considere os conjuntos M {1,2,` e N {2,,`. Temos que M N {2,`, M N {1,2,,` , M – N {1` e N – M {`. Exemplo 1.9. Considere os intervalos I (,1@ eJ [ô, /2 . Temos que I J [2,@, I J (,/2 , I – J (,ô e J – I (1,/2 . (PSDUWLFXODUTXDQGRA BRUHVXOWDGRGDVRSHUDo}HVGHÀQLGDVDFLPD SDUD HVVHV FRQMXQWRV ÀFD A B A, A B B e A – B Ø. Neste caso, FRVWXPDVHFKDPDUDGLIHUHQoDB –A como o complemento de A em relação a B HGHQRWiODSRUCB(A ou CBA. 'HÀQLomR Dados dois conjuntos, A e B GL]HPRV TXH R SURGXWR cartesiano entre A e B, denotado por AðB, é o conjunto A × B {(x, y xA yB`. 2EVHUYHTXHRVHOHPHQWRVGRFRQMXQWRAðB não são elementos de A nem de B. Eles possuem um natureza híbrida e são chamados de vetores. Cada entrada do vetor carrega informação relacionada ao respectivo conjunto no produto cartesiano. Exemplo 1.10. Sejam M e N como no Exemplo 1.8. Temos que o vetor (1,2 MðN, isto porque 1 M e 2 N. No entanto, (1,2 NðM. 'DGRVGRLVFRQMXQWRVÀQLWRVA e B, a cardinalidade do conjunto AðB é FDOFXODGDDVVLP #(AðB #A#B, isto é, o número de vetores da forma (x, y TXH FRQVHJXLPRV IRUPDU FRP elementos do conjunto A na primeira entrada e elementos do conjunto B na segunda entrada correspondem ao produto da cardinalidade dos dois conjuntos HQYROYLGRV4XDQGRRSURGXWRFDUWHVLDQRDSUHVHQWDSHORPHQRVXPFRQMXQWR LQÀQLWRHQWmRVXDFDUGLQDOLGDGHVHUiLQÀQLWD Exemplo 1.11. Sejam I e J os conjuntos apresentados no Exemplo 1.9. Temos que o vetor (ô,1 IðJ, enquanto o vetor(1,ô I × J. Além disso, #(I × J , isto é, o conjunto IðJ contém infinitos vetores.
Série Novos Autores da Educação Profissional e Tecnológica
27
28
Capítulo I - Uma introdução à teoria de conjuntos
3 Conjuntos numéricos Nas seções anteriores, vimos exemplos de importantes conjuntos FRQVWLWXtGRVSRUQ~PHURVN, Z, Q e R5HIHULUHPRQRVDHVVHVFRQMXQWRVRXD seus subconjuntos, como sendo FRQMXQWRVQXPpULFRV. 2 FRQMXQWR GRV Q~PHURV UDFLRQDLV Q IRL DSUHVHQWDGR QR ([HPSOR FRPR VHQGR R FRQMXQWR GRV Q~PHURV TXH SRVVXHP XPD UHSUHVHQWDomR QR IRUPDWRGHIUDomR0DVRTXHTXHUGL]HUXPDIUDomR"
3.1 Uma interpretação para frações ,QLFLDOPHQWHREVHUYHTXHWRGRQ~PHURLQWHLURSRGHVHUHVFULWRQRIRUPDWR de fração. Por exemplo,
eSRULVVRTXHGL]HPRVTXHZ Q. Considere, agora, a fração
1RWH TXH p D UHSUHVHQWDomR GHFLPDO GD IUDomR REWLGD SHOD DSOLFDomRGRDOJRULWPRGDGLYLVmR3RGHPRVLQWHUSUHWDUD(TXDomR DVVLP RWDPDQKRGRQ~PHURp1,YH]RWDPDQKRGRQ~PHUR2 Analogamente, se considerarmos a fração SRGHPRVLQWHUSUHWiODFRPR RWDPDQKRGRQ~PHURp,YH]RWDPDQKRGRQ~PHUR
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
4XDQGR FRQVLGHUDPRV IUDo}HV FRP GHQRPLQDGRU GL]HPRV WHU Dt um número percentual5 e o símbolo % é usado para denotar essa situação. Por exemplo,
3DUD VH FDOFXODU XP SHUFHQWXDO TXDOTXHU GH XP GDGR Q~PHUR EDVWD multiplicar o número percentual pelo número dado. Exemplo 1.12. Numa fazenda, o rebanho bovino é constituido de 500 cabeças, das quais 20% são vacas leiteiras. Então, o número de vacas leiteiras da fazenda é: 2GH ,2 1 $VVLP SRGHPRV YROWDU R ROKDU SDUD D (TXDomR H SURSRU D VHJXLQWH LQWHUSUHWDomRSDUDHOD
isto é, FRUUHVSRQGHDRQ~PHUR2DXPHQWDGRGH $QDORJDPHQWHSRGHPRVLQWHUSUHWUDUD(TXDomR DVVLP
5
OrVHYLQWHSRUFHQWR
Série Novos Autores da Educação Profissional e Tecnológica
29
30
Capítulo I - Uma introdução à teoria de conjuntos
isto é, FRUUHVSRQGHDRQ~PHURDXPHQWDGRGH2 (P VXPD TXDQGR WUDEDOKDPRV FRP IUDo}HV QmR SRGHPRV HVTXHFHU TXH HVWDPRV FRPSDUDQGR GRLV Q~PHURV YHQGR TXDQWR R QXPHUDGRU p PDLRU RXPHQRUGRTXHRGHQRPLQDGRU(VVHUDFLRFtQLRSRGHVHUXVDGRSDUDFDOFXODU rapidamente aumentos ou descontos percentuais. Exemplo 1.13. Numa fazenda, o rebanho bovino é constituido de 500 cabeças. Entre elas, há um touro recentemente adquirido com a intenção de aumentar o rebanho, ao final de 2011, em 20%. Assim, ao final do ano, a previsão é de que o rebanho passe a ser de
DXPHQWDQGRGH2 +,2 (1+,2 1,2 FDEHoDV
Exemplo 1.14. Numa fazenda, o rebanho bovino é constituido de 500 cabeças. Uma doença atingiu o rebanho e dizimou 20% daquela população. Assim, restam
UHGX]LGRVGH2 ²,2 (1²,2 , FDEHoDV
*HQHUDOL]DQGR DV LGpLDV H[SRVWDV QRV H[HPSORV H FRQVLGHUHXPDTXDQWLGDGHTXDOTXHUC e um número percentual i. Para calcular o percentual i de C, basta multiplicar i.CSDUDFDOFXODUDTXDQWLGDGHC com um aumento percentual i, basta multiplicar (1 + i .CHÀQDOPHQWHSDUDVHFDOFXODU o valor de C, submetido a um desconto percentual i, basta multiplicar (1 – i .C. Exemplo 1.15. (juros compostos) Um capital de R$5.000,00 foi aplicado na poupança, que rende juros mensais fixos de 0,5% ao mês. Vamos acompanhar a evolução desse capital ao longo do tempo, denotando por M(t) o montante t meses depois da aplicação. Observe que
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
M( , M(1 (1+, 1,, M(2 M(1 1, (1, 1, (1, 2, M( M(2 1, [(1, 2@1, (1, , M( M( 1, [(1, @1, (1, e, em geral, passados t meses depois da aplicação, teremos um montante igual a M(t M(t²1 1, [(1, t²1@1, (1, t 6HFRQVLGHUDUPRVXPFDSLWDOTXDOTXHUCVHQGRLQYHVWLGRQXPDDSOLFDomRTXH WHPXPDWD[DÀ[DGHUHWRUQRPHQVDOiTXDOTXHUFRPRSDUWLFXODUL]DGRQR([HPSOR REWHUHPRVTXHRPRQWDQWHM(t da aplicação ao longo do tempo tREHGHFHjOHL M(t C(1+i t TXHpDIDPRVDfunção exponencialTXHUHJXODRVFKDPDGRVMXURVFRPSRVWRV.
3.2 Dízimas periódicas 't]LPDVSHULyGLFDVVmRIUDo}HVTXHQmRSRVVXHPUHSUHVHQWDomRGHFLPDO ÀQLWDPDVDSUHVHQWDPXPFRPSRUWDPHQWRGHFLPDOEHPGHÀQLGRHVWUXWXUDGR previsível. Por exemplo, os números
VmRGt]LPDVSHULyGLFDVSRLVFRQVHJXLPRVDGYLQKDUTXDLVRVSUy[LPRVQ~PHURVQDV VXDV UHSUHVHQWDo}HV GHFLPDLV LQÀQLWDV -i SDUD R Q~PHUR HVVD WDUHIDpLPSRVVtYHO7UDWDVHSRUWDQWRGHXPQ~PHURLUUDFLRQDO 1R GLD D GLD ID]HPRV DSUR[LPDo}HV TXDQGR OLGDPRV FRP Q~PHURV FRP UHSUHVHQWDomR GHFLPDO PXLWR H[WHQVD TXH SRGHP VHU GR WLSR WUXQFDPHQWR RX
Série Novos Autores da Educação Profissional e Tecnológica
31
32
Capítulo I - Uma introdução à teoria de conjuntos
arredondamento. Fazer uma aproximação de um número decimal consiste em escolher XPDTXDQWLGDGHGHFDVDVGHFLPDLVWDOTXHSDUDDOpPGHODVDTXHODLQIRUPDomRQmRWHP VHQWLGRSUiWLFR1RFDVRGRWUXQFDPHQWRDVGHPDLVFDVDVGHFLPDLVVmRGHVSUH]DGDV Exemplo 1.16. Quando falamos de dinheiro, de real é, aproximadamente, 0,33 real. Representaremos essa situação assim:
Essa situação pode ser vista como um truncamento. -i QR FDVR GR DUUHGRQGDPHQWR GHYH KDYHU XP FULWpULR TXH QRV IDoD decidir se as demais casas decimais serão desprezadas ou se acrescerão uma XQLGDGHj~OWLPDFDVDGHFLPDOTXHVHUiSUHVHUYDGDQRQ~PHUR Exemplo 1.17. O sistema de registro de notas do IFB em 2009 admitia apenas as notas como registro do aproveitamento final de cada etapa. Se a soma das notas parciais relativas aos instrumentos avaliativos de uma etapa fosse qualquer número diferente dos admitidos, o critério era arredondá-lo para a nota maior e mais próxima entre as admitidas. Em outras palavras, um estudante cuja soma de pontos for 5,333... no 1o bimestre terá sua nota lançada como 5,5. 1RHQWDQWRHPPXLWDVVLWXDo}HVHVVDSUDWLFLGDGHSRGHQmRVHUVXÀFLHQWH e, dependendo da grosseria da aproximação, erros podem se propagar e gerar JUDQGHVSUHMXt]RVPDWHULDLVRXOHYDUDFRQFOXV}HVQmRUD]RiYHLVeRTXHDFRQWHFH SRUH[HPSORWUDWDQGRVHGHSURJUDPDomRFRPSXWDFLRQDO 4XDQGROLGDPRVFRPGt]LPDVSHULyGLFDVVHPSUHpSRVVtYHOVDEHUTXDOp DIUDomRTXHDJHURXWDPEpPFRQKHFLGDFRPRIUDomRJHUDWUL]. Para isso, basta FRQVLGHUDUXPP~OWLSORjSRWrQFLDGHDGHTXDGDGDGt]LPDSHULyGLFDHVXEWUDLU desse múltiplo a dízima, obtendo, assim, sua fração geratriz. Exemplo 1.18. Sabemos que y , é uma dízima periódica. Nesse caso, se fizermos a contay – y, obteremos uma representação em forma de fração para y. De fato,
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
1RH[HPSORDQWHULRURP~OWLSORyIRLHVFROKLGRSRUFRQYHQLrQFLDSRLV a parte periódica na subtração se alinha, tornando a conta possível de ser feita. 2H[HPSORDEDL[RDSUHVHQWDXPDVLWXDomRGLIHUHQWH Exemplo 1.19. Sabemos que z 1,1222 é uma dízima periódica. Nesse caso, a fração geratriz de z será obtida efetuando-se a contaz – z. De fato,
1HVVH~OWLPRH[HPSORDFRQYHQLrQFLDH[LJLXTXHRP~OWLSORy fosse o escolhido, pois o período da dízima periódica possuía dois números.
3.3 Proporcionalidade 9LPRVFRPRQD(TXDomRTXHXPPHVPRQ~PHURUDFLRQDOSRGHVHU HVFULWRVREIRUPDGHIUDomRGHPDQHLUDVGLIHUHQWHV9LPRVWDPEpPTXHDGLYLVmR de (razão entre) dois números expressa uma comparação entre eles, ou seja, o TXDQWRRQXPHUDGRUpPDLRURXPHQRUGRTXHRGHQRPLQDGRUGDIUDomR Exemplo 1.20. “Nesta primeira avaliação da safra nacional dos cereais, leguminosas e oleaginosas para 2010, estima-se uma produção de 143,4 milhões de toneladas, superior 7,2% à obtida no ano passado. A área a ser colhida é 2,1% maior que a da safra de 2009, que foi de 47,2 milhões de hectares.” (IBGE, 2010, adaptado). 2EVHUYHQHVVHH[HPSORTXHIRUDPFRPSDUDGRVQ~PHURVTXHH[SUHVVDP TXDQWLGDGHVGHXPDPHVPDJUDQGH]D,QRFDVRDVJUDQGH]DVWRQHODGDHiUHD 2H[HPSORDVHJXLUpXPSRXFRGLIHUHQWH
2 SHUtRGR GH XPD Gt]LPD SHULyGLFD FRUUHVSRQGH j TXDQWLGDGH GH Q~PHURV TXH WHP VHX FRPSRUWDPHQWRUHSURGX]LGRDRLQÀQLWR (QWHQGHPRVJUDQGH]DFRPRVHQGRRDWULEXWRItVLFRGHXPFRUSRTXHSRGHVHUTXDOLWDWLYDPHQWH GLVWLQJXLGR H TXDQWLWDWLYDPHQWH GHWHUPLQDGR &RPR H[HPSORV GH JUDQGH]DV WHPRV D GLVWkQFLD percorrida por um carro, a altura de um prédio, o tempo de vida de um animal, a espessura de uma FDPDGDGHDVIDOWRDFDUGLQDOLGDGHGHXPFRQMXQWRÀQLWRHQWUHRXWUDV
Série Novos Autores da Educação Profissional e Tecnológica
33
34
Capítulo I - Uma introdução à teoria de conjuntos
Exemplo 1.21. Na frase “O avião foi perdendo altura, à razão de 7 mil pés por minuto e se despedaçou ”,8 a razão empregada expressa a velocidade de queda do avião, que, de forma equivalente, poderia ser informada como 14 mil pés por 2 minutos, ou 420 mil pés por hora.
FIGURA 1:&(5($,6/(*80,126$6(2/($*,126$6É5($(352'8d®2 %5$6,/$ FRQWH,%*(
1RWHTXHRQXPHUDGRUHRGHQRPLQDGRUGDUD]mRGHVVHH[HPSORUHWUDWDP TXDQWLGDGHV GH JUDQGH]DV GLIHUHQWHV FRPSULPHQWR H WHPSR 7RGDYLD VH SHQVDUPRVTXH
FRQFOXtPRVTXHDUD]mRHQWUHDVGXDVJUDQGH]DVGHWHUPLQDRXWUDJUDQGH]DD YHORFLGDGHGHTXHGDGRDYLmR Em nosso cotidiano, as grandezas se relacionam o tempo todo. Por H[HPSORTXDQGRYDPRVDRVXSHUPHUFDGRFRPSUDUXPGHWHUPLQDGRSURGXWR
7UHFKRH[WUDtGRGHPDWpULDSXEOLFDGDQRVLWHKWWSSWZLNLQHZVRUJHPGHDJRVWRGH
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
RYDORUDVHUSDJRQRFDL[DVHUHODFLRQDFRPDTXDQWLGDGHGRSURGXWRTXDQGR SHJDPRV XP Wi[L DV JUDQGH]DV SUHoR GD FRUULGD H GLVWkQFLD SHUFRUULGD VH UHODFLRQDPTXDQGRXPELRTXtPLFRDGPLQLVWUDXPDVXEVWkQFLDDÀPGHLQLELUR crescimento de uma colônia de bactérias, o tempo de reação do medicamento VH UHODFLRQD FRP R WDPDQKR GD SRSXODomR UHVLGXDO GH EDFWpULDV TXDQGR XP DJU{QRPRVXSOHPHQWDDDOLPHQWDomRGHXPUHEDQKRDVJUDQGH]DVTXDQWLGDGH de alimento consumido e massa do animal podem estar relacionadas. 2IDWRpTXHGXDVRXPDLVJUDQGH]DVSRGHPVHUHODFLRQDUGDVPDLVGLIHUHQWHV IRUPDV 7UDWDUHPRV DTXL GH XPD IRUPD PXLWR SDUWLFXODU GH UHODFLRQDPHQWR entre grandezas, mas de grande utilidade para resolver problemas simples do QRVVRGLDDGLDDSURSRUFLRQDOLGDGH Intuitivamente, observamos a proporcionalidade entre duas grandezas incrementando uma delas e observando se essa ação gera um incremento UHODWLYDPHQWHLJXDOQDRXWUDJUDQGH]DRXLQYHUVR1RSULPHLURFDVRGLUHPRVTXH as grandezas são diretamente proporcionaisHQRVHJXQGRFDVRGLUHPRVTXHHODV são inversamente proporcionais. 2VH[HPSORVDEDL[RQRVDMXGDUmRDPHOKRUDUDQRVVDLQWXLomRDUHVSHLWR desse conceito. Exemplo 1.22. Um cliente vai a um supermercado comprar leite. Lá, um litro de leite de caixinha é vendido a R$1,75. Assim, a grandeza “valor da conta” será diretamente proporcional à grandeza “quantidade de caixinhas”. Isso porque, se o cliente dobrar a quantidade de caixinhas, terá sua conta dobrada; se triplicá-la, terá sua conta triplicada, e assim por diante. Exemplo 1.23. Num determinado horário, uma empresa de táxi cobra, por corrida, uma bandeirada no valor de R$4,00, mais R$0,50 cada 200 metros rodados. Se um cliente desejar percorrer 2 quilômetros, pagará R$9,00 pela corrida, enquanto, se desejar percorrer 4 quilômetros, pagará R$14,00. Note que as grandezas “tamanho da corrida” e “preço da corrida” não são diretamente proporcionais, uma vez que o dobro do tamanho da corrida não implica o dobro do preço dela.
Série Novos Autores da Educação Profissional e Tecnológica
35
36
Capítulo I - Uma introdução à teoria de conjuntos
Exemplo 1.24. Um carro faz um percurso fixo a uma velocidade média de 30 km/h e gasta uma hora. Se, na volta, ele dobrar a velocidade média, ele reduzirá o tempo de viagem à metade. Se ele triplicar a velocidade média, seu tempo de viagem será reduzido a um terço do inicial. Assim, as grandezas “velocidade média” e “tempo de viagem” são inversamente proporcionais. )RUPDOPHQWHWHPRVDVHJXLQWHGHÀQLomR 'HÀQLomR Duas grandezas são ditas ser diretamente proporcionais TXDQGRDSUHVHQWDPvariação linearLVWRpTXDQGRDUD]mRHQWUHDVGXDVJUDQGH]DV é constante, H VmR GLWDV VHU LQYHUVDPHQWH SURSRUFLRQDLV TXDQGR DSUHVHQWDP YDULDomRKLSHUEyOLFDLVWRpTXDQGRRSURGXWRGDVGXDVpFRQVWDQWH 3DUDDVVRFLDUDGHÀQLomRIRUPDOGHSURSRUFLRQDOLGDGHFRPDQRomRLQWXLWLYD construída anteriormente, sejam X( e Y( duas grandezas relacionadas. Essas grandezas apresentarão variação linear se
e apresentarão variação hiperbólica se X(t Y(t c,qualquer que seja o t onde cpXPDFRQVWDQWHTXDOTXHUQmRQXOD $VVLPVHQR([HPSORX( UHSUHVHQWDD´TXDQWLGDGHGHFDL[LQKDVµH Y( representa o “valor da conta”, então X(2 UHSUHVHQWDUiGXDVFDL[DVGHOHLWHH Y(2 UHSUHVHQWDUiRSUHoRSDJRSRUGXDVFDL[DVGHOHLWH9HPRVIDFLOPHQWHTXH
Conhecida como constante de proporcionalidade direta.
Conhecida como constante de proporcionalidade inversa.
As unidades referente a cada grandeza foram, por simplicidade, omitidas, mas devem ser carregadas na interpretação dos problemas.
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
e, em geral,
$QDORJDPHQWH VH QR ([HPSOR FRQVLGHUDUPRV DV JUDQGH]DV X( e Y( como sendo, respectivamente, “velocidade média” e “tempo de viagem”, WHUHPRVVDWLVIHLWDDHTXDomR X(k Y(k ,seja qual for ok $VFRQVWDQWHV5FDL[DHNPREWLGDVDFLPDVmRFRQKHFLGDVFRPR constantes de proporcionalidade.
3.4 Regra de três Apesar de a proporcionalidade ser um tipo de relação muito particular entre grandezas, ela aparece com frequência, sobretudo nas situações cotidianas. Entretanto, é importante frisar a necessidade de analisarmos bem a situação para ver se, de fato, cabe ali raciocínio deste tipo. 1HVWD VHomR DSUHVHQWDUHPRV XP DOJRULWPR HÀFLHQWH SDUD UHVROYHU problemas envolvendo grandezas proporcionais, também conhecido por UHJUD de três. Esses problemas se caracterizam por apresentar diversas informações D UHVSHLWR GH GXDV RX PDLV JUDQGH]DV VHQGR TXH SDUD XPD GDV JUDQGH]DV DSUHVHQWDGDV IDOWD XPD LQIRUPDomR TXH GHYHUi VHU GHVFREHUWD D SDUWLU GDV GHPDLV 'LUHPRV TXH D JUDQGH]D GH LQWHUHVVH p D JUDQGH]D SDUD D TXDO IDOWD XPDLQIRUPDomRHLGHQWLÀFDUHPRVRSUREOHPDFRPRXPSUREOHPDGHUHJUDGH trêsVHFDGDXPDGDVGHPDLVJUDQGH]DVIRUGHDOJXPDPDQHLUDSURSRUFLRQDOj grandeza de interesse. 8PD YH] LGHQWLÀFDGR TXH VH WUDWD GH XP SUREOHPD GH UHJUD GH WUrV H[HFXWDUHPRVDVVHJXLQWHHWDSDV &RQVWUXLU XPD WDEHOD LQIRUPDQGR WRGDV DV JUDQGH]DV HQYROYLGDV QR problema. Nesse exemplo genérico, XVHUiDJUDQGH]DGHLQWHUHVVHH G1,G2,,GQ serão as demais grandezas envolvidas no problema.
Série Novos Autores da Educação Profissional e Tecnológica
37
38
Capítulo I - Uma introdução à teoria de conjuntos
(VFUHYHU QD WDEHOD DV PHGLGDV LQIRUPDGDV QR SUREOHPD SDUD FDGD JUDQGH]D XVDQGR XPD OHWUD TXDOTXHU SDUD UHSUHVHQWDU D PHGLGD TXH VH GHVHMD REWHU TXH VHUi D variável GR SUREOHPD H LGHQWLÀFDU a grandeza de interesse com uma seta apontada para uma direção TXDOTXHU1HVVHH[HPSORJHQpULFRx1, a1, a2, b1, b2, ..., J1, J2 são valores conhecidos e ypDYDULiYHOTXHVHGHVHMDGHVFREULU
3. Comparar cada uma das outras grandezas com a grandeza de interesse, YHULÀFDQGRRWLSRGHSURSRUFLRQDOLGDGH6HIRUGLUHWDLGHQWLÀFDUDRXWUD JUDQGH]D FRP XPD VHWD DSRQWDGD QD GLUHomR GD VHWD TXH LGHQWLÀFD DJUDQGH]DGHLQWHUHVVHVHIRULQYHUVDLGHQWLÀFiODFRPXPDVHWDQD GLUHomRRSRVWDjVHWDTXHLGHQWLÀFDDJUDQGH]DGHLQWHUHVVH
(VVDWDUHIDpPDLVGHOLFDGDTXDQGRVHWHPPXLWDVJUDQGH]DVSRLVH[LJHTXHVLPSOLTXHPRVRSUREOHPD DXPDVLWXDomRSDUHFLGDQDTXDODSHQDVGXDVJUDQGH]DVYDULDPHQTXDQWRDVRXWUDVSHUPDQHFHPÀ[DV
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
$SDUWLUGRVHOHPHQWRVGDWDEHODPRQWDUDHTXDomR
REHGHFHQGRDRTXHFKDPDUHPRVGHcritério de inversão. 5HVROYDDHTXDomRLVRODQGRDYDULiYHOGRSUREOHPD 2TXHFKDPDPRVGHFULWpULRGHLQYHUVmRQDYHUGDGHpXPDUHJUDPXLWR VLPSOHVTXHFRQVLVWHHPLQYHUWHUDUD]mRFRPDVPHGLGDVGDJUDQGH]DTXHWLYHU VLGRLGHQWLÀFDGDFRPXPDVHWDDSRQWDGDSDUDDGLUHomRRSRVWDjVHWDGDYDULiYHO de interesse. ([HFXWDQGR HVVH DOJRULWPR FRQVHJXLUHPRV UHVROYHU TXDOTXHU SUREOHPD GHUHJUDGHWUrV Exemplo 1.25.5HJUDGHWUrVVLPSOHV Um homem percorre um trajeto de bicicleta. Se, pedalando à velocidade de 5 km/h, ele demora 6 horas, quanto tempo o homem demorará para percorrer esse mesmo trajeto a uma velocidade 3 Km/h? Primeiramente, montemos a tabela com as respectivas medidas informadas pelo problema.
2EVHUYHTXHHVWDPRVLQWHUHVVDGRVQDJUDQGH]DWHPSR1RWHWDPEpPTXH YHORFLGDGHHWHPSRVmRJUDQGH]DVLQYHUVDPHQWHSURSRUFLRQDLVLVWRpTXDQWR PHQRUIRUDYHORFLGDGHGHVHQYROYLGDSHORFLFOLVWDPDLRUVHUiRWHPSRJDVWRQR WUDMHWR$VVLP
Série Novos Autores da Educação Profissional e Tecnológica
39
40
Capítulo I - Uma introdução à teoria de conjuntos
Finalmente, montamos a proporção, obedecendo ao critério de inversão, HHIHWXDPRVDVFRQWDV
Problemas como o resolvido no exemplo acima são ditos ser de UHJUDGHWUrV simplesHUHFHEHPHVVHQRPHSRUHQYROYHUHPDSHQDVGXDVJUDQGH]DV4XDQGR envolvem mais de duas grandezas, costumam ser chamados de problemas de UHJUDGHWUrVFRPSRVWD. Exemplo 1.26.5HJUDGHWUrVFRPSRVWD Uma família subsiste da criação de 2 bois e, alimentando-os durante 8 dias, são consumidas 480 gramas de sal mineral. Se mais 2 bois são comprados, qual deverá ser a quantidade de sal mineral para a alimentação de todos os animais durante 12 dias? Primeiramente, montemos a tabela com as respectivas medidas informadas pelo problema.
2EVHUYHTXHHVWDPRVLQWHUHVVDGRVQDJUDQGH]DJUDPDVHSDUDGHVFREULUR valor de xGHYHUHPRVYHULÀFDUDUHODomRGHSURSRUFLRQDOLGDGHTXHFDGDXPDGDV RXWUDVJUDQGH]DVSRVVXLFRPDJUDQGH]DGHLQWHUHVVH1RWHTXHTXDQWRPDLRU D TXDQWLGDGH GH DQLPDLV PDLRU GHYHUi VHU D TXDQWLGDGH GH VDO PLQHUDO SDUD DOLPHQWiORV/RJRDVJUDQGH]DVERLVHJUDPDVVmRGLUHWDPHQWHSURSRUFLRQDLV
3RURXWURODGRTXDQWRPDLRURWHPSRGHDOLPHQWDomRGRVDQLPDLVPDLRU GHYHUiVHUDTXDQWLGDGHGHDOLPHQWRGLVSRQtYHO/RJRDVJUDQGH]DVJUDPDVH tempo também são diretamente proporcionais.
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
Finalmente, montamos a proporção e efetuamos as contas. Neste caso, não precisaremos inverter nenhuma das razões.
5HVXPLQGR DV LQIRUPDo}HV GHVWD VHomR YLPRV QD VXEVHomR XPD interpretação para a razão de dois números pertencentes a um mesmo conjunto, VHPQRVSUHRFXSDUPRVFRPRTXHHOHVUHSUHVHQWDP1DVXEVHomRYLPRVXPD LQWHUSUHWDomRSDUDHVVDVPHVPDVUD]}HVPDVTXDQGRQXPHUDGRUHGHQRPLQDGRU UHSUHVHQWDPFRLVDVGLIHUHQWHVLVWRpQ~PHURVTXHPHGHPJUDQGH]DVGLIHUHQWHV 4XDQGROLGDPRVFRPDUD]mRGHGRLVQ~PHURVTXHUHSUHVHQWDPPHGLGDV GH XPD PHVPD JUDQGH]D UHWRUQDPRV QD YHUGDGH j VLWXDomR DERUGDGD QD 6XEVHomR'HIDWRFRPRVXJHUHRH[HPSORDEDL[R
Exercícios 1XPD SHVTXLVD GH RSLQLmR S~EOLFD D UHVSHLWR GR FRQVXPR GH GXDV PDUFDVGHXPPHVPRSURGXWRSHVVRDVIRUDPHQWUHYLVWDVHQWUHDV TXDLVGHFODUDUDPFRQVXPLURSURGXWR$GHFODUDUDPFRQVXPLU o produto B, e 5 declararam não consumir nenhum dos produtos. 4XDQWRVGHVVHVFRQVXPLGRUHVFRQVRPHPDPERVRVSURGXWRV" D E F d) 5. H
Série Novos Autores da Educação Profissional e Tecnológica
41
42
Capítulo I - Uma introdução à teoria de conjuntos
(PXPDHVFRODGRVHVWXGDQWHVJRVWDPGHLQJOrVJRVWDP GHHVSDQKROHQmRJRVWDPGHQHQKXPGRVGRLVLGLRPDV4XDOR SHUFHQWXDOGHHVWXGDQWHVTXHJRVWDDSHQDVGHHVSDQKRO"
D E F G H
,)% (P FHUWR DQR XPD HVFROD FRP HVWXGDQWHV RIHUHFLD RÀFLQDV H D PDWUtFXOD HUD REULJDWyULD HP SHOR PHQRV XPD GHODV H R HVWXGDQWH SRGHULD VH PDWULFXODU HPQR Pi[LPRGXDV )HLWDV DV PDWULFXODVDSXURXVHTXHHVWXGDQWHVIDULDPP~VLFDHIDULDP MXG{ 6DEHQGRVH TXH R Q~PHUR GH HVWXGDQWHV TXH IDUmR DPEDV DV DWLYLGDGHVFRUUHVSRQGHjPHWDGHGRQXPHURGHHVWXGDQWHVTXHIDUmR RXWUDVRÀFLQDVDVVLQDOHD~QLFDDOWHUQDWLYD,1&255(7$
D HVWXGDQWHVQmRIDUmRPXVLFDQHPMXG{ E HVWXGDQWHVPDWULFXODUDPVHDSHQDVPXVLFD F HVWXGDQWHVPDWULFXODUDPVHHPPXVLFDHMXG{ G HVWXGDQWHVPDWULFXODUDPVHDSHQDVHPMXG{ H 2 QXPHUR GH HVWXGDQWHV TXH VH PDWULFXODUDP Vy HP P~VLFD RX VyHPMXG{pLJXDODRQ~PHURGHHVWXGDQWHVTXHQmRIDUmRQHP música nem judô.
,)% 1XPFRQFXUVRS~EOLFRGHQtYHOPpGLRYHULÀFRXVHTXHGRV FDQGLGDWRV WLQKDP QtYHO VXSHULRU HQWUH RV TXDLV HUDP KRPHQV 6DEHQGR TXH GRV FDQGLGDWRV HUDP KRPHQV DVVLQDOH D ~QLFD DOWHUQDWLYD&255(7$
D GRVFDQGLGDWRVVmRPXOKHUHVTXHQmRSRVVXHPFXUVRVXSHULRU E GRVFDQGLGDWRVVmRPXOKHUHVTXHSRVVXHPFXUVRVXSHULRU F GDVFDQGLGDWDVPXOKHUHVQmRSRVVXHPFXUVRVXSHULRU G GRVFDQGLGDWRVVmRKRPHQVTXHSRVVXHPFXUVRVXSHULRU H +iPDLVFDQGLGDWRVKRPHQVVHPFXUVRVXSHULRUGRTXHFDQGLGDWDV mulheres com curso superior.
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
,)% 1XPDHVFRODKiHVWXGDQWHV6DEHQGRVHTXHDTXDQWLGDGH GHPHQLQRVpWUrVYH]HVPDLRUTXHDTXDQWLGDGHGHPHQLQDVHQWmR HVWXGDPQHVVDHVFROD
D PHQLQRVHPHQLQDV E PHQLQRVHPHQLQDV F PHQLQRVHPHQLQDV G PHQLQRVHPHQLQDV H PHQLQRVHPHQLQDV
,)% &RQVLGHUHTXHGRVKyVSHGHVGHXPKRWHOWRPDUDPFDIp SHODPDQKmHWRPDUDPOHLWH6DEHQGRTXHGHOHVRSWDUDPSRU QmRWRPDUFDIpQHPOHLWHDVVLQDOHDRSomR,1&255(7$
a) 5 hóspedes tomaram leite, mas não tomaram café. b) 5 hóspedes tomaram café, mas não tomaram leite. F KyVSHGHVWRPDUDPVyFDIpRXVyOHLWH G KyVSHGHVWRPDUDPFDIpRXWRPDUDPOHLWH H KyVSHGHVWRPDUDPFDIpHOHLWH
,)* 2YDORUGDH[SUHVVmRQXPpULFD
é
D E F G H
,)* 'RV FDQGLGDWRV TXH VH LQVFUHYHUDP SDUD XP SURFHVVR VHOHWLYR DSHQDV FRPSDUHFHUDP (QWmR SRGHVH DÀUPDU TXH R tQGLFHSHUFHQWXDOGHQmRFRPSDUHFLPHQWRIRLGH
D E F G e)
Série Novos Autores da Educação Profissional e Tecnológica
43
44
Capítulo I - Uma introdução à teoria de conjuntos
,)% &RPSUHLXPFRPSXWDGRUSRUGRTXHHOHYDOLDKiXPPrVH FRPLVVRHFRQRPL]HL5$VVLPHVVHFRPSXWDGRUPHFXVWRX
D 5 E 5 F 5 G 5 H 5
,)* 1DFRPSUDGHXPDFDPLVDREWHYHVHXPGHVFRQWRGHRTXH SURSRUFLRQRXXPDHFRQRPLDGH54XDQWRIRLSDJRSHODFDPLVD"
D 5 E 5 F 5 G 5 H 5
,)* 4XDO D WD[D ÀQDO GH DXPHQWR GH XP SURGXWR TXH VRIUHXXP reajuste de % e, logo em seguida, foi reajustado em 5% sobre o valor DQWHULRU"
D E F G H
,)* 8POLYURTXHFXVWDYD5IRLYHQGLGRSRU54XDOIRL DWD[DSHUFHQWXDOGHGHVFRQWR"
D E F G H
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
,)% 2JUiÀFRDEDL[RUHSUHVHQWDDHYROXomRGRSDWULP{QLRGHXPD HPSUHVDHQWUHH1RHL[RKRUL]RQWDOHVWmRPDUFDGRVRV DQRV HP TXH IRUDP UHDOL]DGRV RV EDODQoRV 1R HL[R YHUWLFDO HVWmR assinalados os valores (em milhares de reais) do patrimônio. Com EDVHQRJUiÀFRp&255(72DÀUPDUTXH
a) comparado com o início do período observado, a empresa DSUHVHQWRXXPDXPHQWRGRSDWULP{QLRVXSHULRUD E GH SDUD KRXYH XPD TXHGD GH QR SDWULP{QLR dessa empresa. c) com o crescimento percentual no patrimônio observado entre RVDQRVHIRLLJXDODRREVHUYDGRHQWUHRVDQRV H d) comparado com o ano anterior, o maior crescimento do patrimônio GDHPSUHVDVHGHXHP e) o patrimônio da empresa apresentou desempenho crescente no período observado.
Série Novos Autores da Educação Profissional e Tecnológica
45
46
Capítulo I - Uma introdução à teoria de conjuntos
,)% 8PDORMDUHYHQGHSURGXWRVLPSRUWDGRV2SUHoRGHYHQGDGHVHXV SURGXWRVpHVWDEHOHFLGRFRQVLGHUDQGRXPDPDUJHPGHOXFURGH sobre o preço da venda. Assim, o lucro gerado por um produto importado DXPYDORUFRUUHVSRQGHQWHD5HUHYHQGLGRQHVVDORMDVHUiGH D 5 E 5 F 5 G 5 H 5 ,)% 2SUHoRGHXPDPHUFDGRULDIRLVXEPHWLGRVXFHVVLYDPHQWHjV seguintes variações percentuais de preço durante o ano passado.
&RPEDVHQHVVDVLQIRUPDo}HVpFRUUHWRDÀUPDUTXH D $RÀQDOGRDQRSDVVDGRRSUHoRGDPHUFDGRULDDSUHVHQWDYDXP GHVFRQWRLQIHULRUDFRPSDUDGRFRPRSUHoRGDPHUFDGRULD no início do ano. E $R ÀQDO GR DQR SDVVDGR R YDORU GD PHUFDGRULD HUD R PHVPR DSUHVHQWDGRQRLQtFLRGDTXHOHDQR F $RÀQDOGRDQRSDVVDGRRYDORUGDPHUFDGRULDHVWDYDPDLRU GRTXHQRLQtFLRGDTXHOHDQR G $RÀQDOGRDQRSDVVDGRRYDORUGDPHUFDGRULDHVWDYDPDLRU GRTXHQRLQtFLRGDTXHOHDQR H $RÀQDOGRDQRSDVVDGRRYDORUGDPHUFDGRULDHVWDYDPHQRU GRTXHQRLQtFLRGDTXHOHDQR
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
,)% &RQVLGHUHTXHXPDSHVVRDWHQKDUHFHELGR5GHXP SUrPLRGDORWHULDHWHQKDXVDGRGHVWHSUrPLRSDUDSDJDUXPD GtYLGD$OpPGLVVRJDVWRXGRTXHUHVWRXFRPXPDIHVWD4XH TXDQWLDVREURXGRSUrPLR" D 5 E 5 F 5 G 5 H 5 ,)% 8PD ORMD RIHUHFLD VXDV PHUFDGRULDV HP GRLV SODQRV GH SDJDPHQWR 3/$12jYLVWDFRPGHVFRQWRGH 3/$12HPGXDVSDUFHODVLJXDLVVHQGRXPDHQWUDGDHDRXWUDD VHUSDJDHPGLDV
&RQVLGHUDQGRHVVDVLWXDomRpFRUUHWRDÀUPDUTXH D DWD[DGHMXURVPHQVDOGDORMDpVXSHULRUD b) a taxa de juros mensal da loja é de 5%. F DWD[DGHMXURVPHQVDOGDORMDpGH d) a taxa de juros mensal da loja é inferior a 5%. H DWD[DGHMXURVPHQVDOGDORMDpPDLRUGRTXHHPHQRUGRTXH
,)% +iDOJXPWHPSRXPLQYHVWLGRUFRPSURXXPDSDUWDPHWRHP %UDVtOLDHKRMHGHVHMDUHYHQGrOR2SRVVtYHOFRPSUDGRUGLVS}HGHk UHDLVSDUDDHQWUDGDTXDQWLDHVVDTXHpPHQRUGRTXHRYDORU JDVWRSHORLQYHVWLGRUjpSRFDGDFRPSUDGRLPyYHO6HRLQYHVWLGRU GHVHMDWHUXPOXFURGHSHORPHQRVVREUHRYDORUTXHJDVWRX SDUDDGTXLULURLPyYHOTXDOGHYHVHURSUHoRPtQLPRGHYHQGD" a) 3k reais. b) 4k reais. F k reais. G k reais. H k reais.
Série Novos Autores da Educação Profissional e Tecnológica
47
48
Capítulo I - Uma introdução à teoria de conjuntos
,)% 2 WH[WR D VHJXLU IRL UHWLUDGR GR site RÀFLDO GR ,%*( H WUDWD GDSURGXWLYLGDGHGHDOJXQVSURGXWRVDJUtFRODVHVWLPDGDSDUD comparada com o ano anterior. Nesta primeira avaliação da safra nacional dos cereais, OHJXPLQRVDV H ROHDJLQRVDV SDUD HVWLPDVH XPD SURGXomR GH PLOK}HV GH WRQHODGDV VXSHULRU jREWLGDQRDQRSDVVDGR$iUHDDVHUFROKLGDVHUiPDLRU TXHDGDVDIUDGHTXHIRLGHPLOK}HVGH hectares (IBGE, com adaptações).
&RPEDVHQHVWDVLQIRUPDo}HVHVWLPDVHTXH D DSURGXWLYLGDGHGHVXSHUDUiDSURGXWLYLGDGHGHHPXP SHUFHQWXDOTXHHVWiHQWUHH E DSURGXWLYLGDGHGHVXSHUDUiDSURGXWLYLGDGHGHHP XPSHUFHQWXDOTXHHVWiHQWUHH F DSURGXWLYLGDGHGHVXSHUDUDUiDSURGXWLYLGDGHGHHP XPSHUFHQWXDOTXHHVWiHQWUHH G DSURGXWLYLGDGHGHVXSHUDUiDSURGXWLYLGDGHGHHP XPSHUFHQWXDOTXHHVWiHQWUHH H DSURGXWLYLGDGHGHVXSHUDUiDSURGXWLYLGDGHGHHPXP SHUFHQWXDOTXHHVWiHQWUHH ,)% $Wp R PrV SDVVDGR R SUHoR GH YHQGD GH XP SURGXWR HUD calculado a partir do seu custo de fabricação, acrescido de uma PDUJHP GH OXFUR GH 1HVWH PrV R FXVWR GH IDEULFDomR GR SURGXWRUHGX]LXVHHPHRDGPLQLVWUDGRUUHVROYHXDSOLFDUXP UHDMXVWHGHVREUHRSUHoRGHYHQGDGHVVHSURGXWR(VVDPHGLGD IH]FRPTXHQHVWHPrV D RSUHoRGHYHQGDGRSURGXWRGLPLQXLVVH E RSUHoRGHYHQGDGRSURGXWRDXPHQWDVVH c) o preço de venda do produto permanesse o mesmo. d) a margem de lucro sobre o produto permanecesse a mesma. e) a margem de lucro sobre o produto dobrasse.
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
,)% 8PDSHVTXLVDFRPFULDQoDVPRVWURXDSUHIHUrQFLDGHODV SRU WUrV SHUVRQDJHQV GH GHVHQKR DQLPDGR 2 UHVXOWDGR IRL R VHJXLQWH
(QWmRp&255(72DÀUPDUTXH D FULDQoDVSUHIHUHPR%RE(VSRQMD E DSHQDVFULDQoDVSUHIHUHPR%RE(VSRQMD F DVFULDQoDVSUHIHUHPR6U6LULJXHLMRDR/XOD0ROXVFR G FULDQoDVSUHIHUHPR%RE(VSRQMD H DSHQDVFULDQoDVSUHIHUHPR/XOD0ROXVFR
,)% 6H KRPHQV FRQVWURHP XP PXUR HP KRUDV TXDQWRV KRPHQVVmRQHFHVViULRVSDUDFRQVWUXLURPHVPRPXURHPKRUDV" a) E F G H
5.
Série Novos Autores da Educação Profissional e Tecnológica
49
50
Capítulo I - Uma introdução à teoria de conjuntos
,)% 8P IXQFLRQiULR S~EOLFR GR ,QVWLWXWR )HGHUDO GH (GXFDomR &LrQFLD H 7HFQRORJLD GH %UDVtOLD ,)% YLDMDQGR GH FDUUR D XPD YHORFLGDGH PpGLD GH NPK JDVWRX PHLD KRUD SDUD VH GHVORFDU do campus Plano Piloto ao campus Planaltina. Na volta, no entanto, JDVWRX PLQXWRV $VVLP D YHORFLGDGH PpGLD GHVHQYROYLGD SHOR FDUURGRIXQFLRQiULRQDYROWDGRSHUFXUVRIRLGH D E F G H
NPK NPK NPK NPK NPK
(3&$U 8P WUHP FRP D YHORFLGDGH GH NPK SHUFRUUH FHUWD GLVWkQFLD HP WUrV KRUDV H PHLD 1DV PHVPDV FRQGLo}HV H FRP D YHORFLGDGH GH NPK TXDQWR WHPSR JDVWDUi SDUD SHUFRUUHU D PHVPDGLVWkQFLD"
D E F G H
KPLQV KPLQV KPLQV KPLQV KPLQV
(PGLDVGHWUDEDOKRFRQIHLWHLURVID]HPWRUWDV(PTXDQWRV GLDVFRQIHLWHLURVSRGHUmRID]HUWRUWDV" (P GLDV JDOLQKDV ERWDP RYRV 4XDQWRV RYRV JDOLQKDV ERWDPHPGLDV" ,)% 2V QXWULFLRQLVWDV TXH WUDEDOKDP QR UHVWDXUDQWH GR campus 3ODQDOWLQD LQIRUPDUDP TXH RV FRPHQVDLV XVXiULRV GR UHVWDXUDQWH FRQVRPHP OLWURV GH OHLWH D FDGD GLDV 1R entanto, eles estão preocupados com o aumento de comensais SUHYLVWR SDUD R SUy[LPR VHPHVWUH TXH SDVVDUi D VHU GH HQTXDQWRTXHDSUHYLVmRQRIRUQHFLPHQWRGHOHLWHVHUiGH
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
litros para o mesmo periodo. Considerando essa nova situação, é FRUUHWRDÀUPDUTXH a) havendo um aumento proporcional do consumo, o suprimento GHOHLWHVHUiVXÀFLHQWHSDUDGLDV E QmRKiUD]mRSDUDSUHRFXSDomRXPDYH]TXHRVXSULPHQWRGH leite aumentou proporcionalmente ao número de comensais. c) havendo um aumento proporcional do consumo, o suprimento GHOHLWHVHUiVXÀFLHQWHSDUDQRPi[LPRGLDV d) havendo um aumento proporcional do consumo, o suprimento GHOHLWHVHUiVXÀFLHQWHSDUDSHORPHQRVGLDV e) havendo um aumento proporcional do consumo, o suprimento GHOHLWHVHUiVXÀFLHQWHSDUDGLDV ,)% 8PDHPSUHVDGHUHIULJHUDQWHVJDVWD5HPSURSDJDQGD mensalmente. A tabela a seguir simula os gastos (em reais) dessa empresa HPGHWHUPLQDGRPrVHPIXQomRGDSURGXomRGHUHIULJHUDQWHVHPOLWURV
&RPEDVHQHVVHVGDGRVp&255(72DÀUPDU D TXHDRVHSURGX]LUOLWURVGHUHIULJHUDQWHRFXVWRGROLWURp LQIHULRUD5 E TXH R FXVWR WRWDO GH IDEULFDomR p GLUHWDPHQWH SURSRUFLRQDO j TXDQWLGDGHGHUHIULJHUDQWHSURGX]LGD F TXH R FXVWR WRWDO GH IDEULFDomR p LQYHUVDPHQWH SURSRUFLRQDO j TXDQWLGDGHGHUHIULJHUDQWHSURGX]LGD G TXHDRVHSURGX]LUOLWURVGHUHIULJHUDQWHRFXVWRGROLWURp LQIHULRUD5 H TXH5UHSUHVHQWDXPFXVWRÀ[RGHSURGXomR
Série Novos Autores da Educação Profissional e Tecnológica
51
52
Capítulo I - Uma introdução à teoria de conjuntos
,)% 6HGXDVWRUQHLUDVHQFKHPXPWDQTXHHPPLQXWRVSDUDHQFKHU RPHVPRWDQTXHHPPLQXWRVVmRQHFHVViULDV a) E F G H
5 torneiras. WRUQHLUDV WRUQHLUDV WRUQHLUDV WRUQHLUDV
,)% 6DEHQGRVHTXHGRLVSDGHLURVSURGX]HPNJGHSmRHPGXDV KRUDVpFRUUHWRDÀUPDUTXHSDUDVHSURGX]LURVPHVPRVNJGH SmRHPPLQXWRVVmRQHFHVViULRV D E F G H
SDGHLURV SDGHLURV SDGHLURV SDGHLURV SDGHLURV
,)% 2JUiÀFRDEDL[RPRVWUDRSHUÀOGHGHVHPSHQKRGDVWXUPDV$H %HP0DWHPiWLFDQRDQRSDVVDGR
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
&RPEDVHQRJUiÀFRPDUTXHD~QLFDRSomR&255(7$ a) Nos meses de maio e setembro, ambas as turmas apresentaram o mesmo desempenho. E 1R PrV GH PDLR D WXUPD $ GHPRQVWURX PHOKRU GHVHPSHQKR TXHDWXUPD% F &RPSDUDGRDRPrVGHDEULORGHVHPSHQKRGDWXUPD$FUHVFHX PDLVTXHRGHVHPSHQKRGDWXUPD%QRPrVGHPDLR G $WXUPD%DSUHVHQWRXGHVHPSHQKRPDLVHTXLOLEUDGRTXHDWXUPD A ao longo do ano. H &RPSDUDGRDRPrVGHPDUoRRGHVHPSHQKRGDWXUPD$FUHVFHX PDLVTXHRGHVHPSHQKRGDWXUPD%QRPrVGHDEULO
Série Novos Autores da Educação Profissional e Tecnológica
53
CAPÍTULO II NOÇÕES DE CONTAGEM
Noções de contagem
$ROLGDUPRVFRPXPFRQMXQWRGLVFUHWRÀQLWRVHMDGHFRLVDVGHLQIRUPDo}HV ou mesmo de possibilidades de realização de um determinado experimento, em muitas situações cotidianas precisamos separar, ou mesmo contar, determinados HOHPHQWRVTXHFRPXQJDPGHXPDGHWHUPLQDGDFDUDFWHUtVWLFD Exemplo 2.1. Na abertura de uma conta corrente, o banco exige que o futuro cliente crie uma senha de 7 dígitos, a partir das 26 letras do alfabeto brasileiro e dos algarismos 0,1, ... , 9. Porém, as senhas devem ter os 3 primeiros dígitos formados por letras e os 4 últimos por números. Exemplo 2.2. Para representar o Instituto Federal de Brasília (IFB) num evento tecnológico em Santa Catarina, será enviado um grupo de três estudantes da turma do curso de Agropecuária subsequente ApA1, que possui 40 estudantes matriculados.
58
Capítulo II - Noções de contagem
Na situação do Exemplo 2.1, é possível criar muitas senhas diferentes. 3RUH[HPSORpFHUWRTXHDSURSRVWDGHVHQKD$)(VHMDDFHLWDSHORVLVWHPD HQTXDQWRTXHVHJXUDPHQWHDSURSRVWDGHVHQKD013VHUiUHMHLWDGD$VVLP SRGHPRVFRQFOXLUTXHRFRQMXQWRGHVHQKDVDGPLWLGDVSHORVLVWHPDGREDQFR HVWiFRQWLGRQRXQLYHUVRGHVHQKDVDOIDQXPpULFDVGHGtJLWRV ,PDJLQH DJRUD FRPR IRUPDU VXEFRQMXQWRV GH TXDOTXHU FDUGLQDOLGDGH SRVVtYHODSDUWLUGHXPFRQMXQWRGHSHVVRDV1RWHTXHHVWDPRVIDODQGRGR FRQMXQWRGDVSDUWHVGHVVHFRQMXQWRGHSHVVRDV$VLWXDomRGRExemplo 2.2 se UHIHUHDVXEFRQMXQWRVHVSHFtÀFRVGDTXHODWXUPDGHHVWXGDQWHVRXVHMDDTXHOHV VXEFRQMXQWRVTXHSRVVXHPFDUGLQDOLGDGHLJXDOD $VVLWXDo}HVDSUHVHQWDGDVLQGX]HPDVTXHVW}HVQDWXUDLV 4XDOpDTXDQWLGDGHWRWDOGHVHQKDVDFHLWDVSHORVVLVWHPDGREDQFR" 'HTXDQWDVPDQHLUDVGLVWLQWDVSRGHPRVHVFROKHURJUXSRGHSHVVRDV HQWUHRVHVWXGDQWHVGR$S$SDUDSDUWLFLSDUGRHYHQWR" (VVDV TXHVW}HV VXJHUHP UHVSHFWLYDPHQWH GRLV TXHVWLRQDPHQWRV PDLV JHUDLV Dado um conjunto ƺTXDOTXHUTXDODFDUGLQDOLGDGHGRFRQMXQWRA ƺ TXHUH~QHHOHPHQWRVFRPXPDGDGDFDUDFWHUtVWLFD" Dado um conjunto ƺTXDOTXHUTXDQWRVVXEFRQMXQWRVGHƺ possuem XPDGDGDFDUGLQDOLGDGH" 1RVGHEUXoDUHPRVDJRUDVREUHDWDUHIDGHUHVSRQGHUDHVVDVTXHVW}HV gerais.
1 Os princípios fundamentais da contagem Nas situações listadas no início deste capítulo, precisamos resgatar a QRomRGHFDUGLQDOLGDGHGHXPFRQMXQWRTXHpXPDHVSpFLHGHmedidaTXDQGR
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
estamos trabalhando num universo de conjuntos discretos. Medir um conjunto p DWULEXLUOKH GHWHUPLQDGR SHVR FRPSDUDGR D RXWURV FRQMXQWRV VLPLODUHV 3RU H[HPSORWUDWDQGRVHGHFRQMXQWRVGLVFUHWRVXPFRQMXQWRGHFDUGLQDOLGDGHRX PHGLGD LJXDOVLJQLÀFDTXHHOHSRVVXLHOHPHQWRVHQTXDQWRTXHXPFRQMXQWR GHFDUGLQDOLGHRXPHGLGD ]HURVLJQLÀFDTXHpXPFRQMXQWRYD]LR 2XWUD QRomR LPSRUWDQWH TXH SUHFLVDPRV UHVJDVWDU p D GH SURGXWR FDUWHVLDQR DSUHVHQWDGD QD 'HÀQLomR $ SUy[LPD GHÀQLomR p XPD generalização desse conceito. 'HÀQLomR Dado um conjunto ATXDOTXHUGHÀQLPRVAn como sendo o conjunto
Cada elemento de An é dito ser um vetor n-dimensional. Se A for um conjunto discreto, então AnWDPEpPVHUiGLVFUHWRHVHDOpP disso, #AIRUÀQLWDHQWmRWDPEpPVHUiÀQLWDD#(An . Exemplo 2.3. Se B {,1`, então os vetores B2 {(, ,(,1 ,(1, ,(1,1 ` e B {(,, ,(,,1 ,(,1, ,(,1,1 ,(1,, ,(1,,1 ,(1,1, ,(1,1,1 ` No Exemplo 2.3SHUFHEDTXH#B 2HQTXDQWRTXH#(B2 e #(B . 'HVFREULPRVLVVROLVWDQGRWRGDVDVSRVVLELOLGDGHVGHYHWRUHVFRPGLPHQVmRH UHVSHFWLYDPHQWH0DVTXDOVHUiDFDUGLQDOLGDGHGHB, B ou B"1RTXHVHJXH WHQWDUHPRVUHVSRQGHUDHVVDTXHVWmR Antes disso, contudo, voltemos a analisar a situação do Exemplo 2.1 e QRVFRQFHQWUHPRVHPUHVSRQGHUTXDOpDTXDQWLGDGHGHVHQKDVGHGtJLWRVTXH podemos formar a partir dos elementos do conjunto
Série Novos Autores da Educação Profissional e Tecnológica
59
60
Capítulo II - Noções de contagem
A {,1,,,D,E,,]` &ODUDPHQWH R WUDEDOKR GH VH FULDU XPD VHQKD GH GtJLWRV GHYH VHU GHVHQYROYLGRQDVVHJXLQWHVHWDSDV (E1) escolha do primeiro dígito; (E2) escolha do segundo dígito; . . . (E7) escolha do sétimo dígito. Todas as etapas devem ser executadas e, além disso, elas são independentes XPDV GDV RXWUDV ,VVR VLJQLÀFD TXH D H[HFXomR GD HWDSD Ei não interfere na execução da etapa EjSDUDTXDOTXHU1i, j7, ij. Em situações como essa, podemos usar o 'HÀQLomR 35,1&Ì3,2 08/7,3/,&$7,92 '( &217$*(0 6H XP problema pode ser resolvido em n etapas E1, E2, ..., En independentes, onde #(Ei representa o número de maneiras distintas de se resolver a Etapa Ei, então o conjunto ƺGHWRGDVPDQHLUDVGLVWLQWDVGHVHUHVROYHURSUREOHPDpWDOTXH #ƺ #(E1 . 1RFDVRSDUWLFXODUTXHHVWDPRVWUDWDQGRWHPRVTXH#(Ei TXDOTXHU TXHVHMDi 1,2,7/RJRVHFKDPDUPRVGHƺ o conjunto de todas as senhas DOIDQXPpULFDVGHGtJLWRVWHPRVTXH #ƺ #(E1 #(E7 7
LVWRpRQ~PHURPi[LPRGHVHQKDVDOIDQXPpULFDVTXHSRGHPVHUJHUDGDVFRP GtJLWRVp$VHQKD013pXPDGHVVDVSRVVLELOLGDGHV Se chamarmos de ƭRFRQMXQWRFRQWHQGRWRGDVDVVHQKDVTXHRVLVWHPD EDQFiULRDFHLWDFRPRYiOLGDVWHUHPRVTXHƭƺHTXHDVHQKD7MN7P ƭ,
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
isto é, a inclusão ƭƺ é SUySULD.5HVWDQRVUHVSRQGHUTXDOpDFDUGLQDOLGDGH de ƭVDEHQGRTXHXPHOHPHQWRGHƭSRVVXLOHWUDVQRVWUrVSULPHLURVGtJLWRVH Q~PHURVQRVGHPDLV&RPRDQWHVSURFHGDPRVSRUHWDSDV (E1) escolha do primeiro dígito; (E2) escolha do segundo dígito; . . . (E7) escolha do sétimo dígito.
Como na situação anterior, as etapas Ei , i 1,,7 são independentes. /RJRSHORSULQFtSLRPXOWLSOLFDWLYRGHFRQWDJHPWHUHPRV #ƭ #(E1 #(E2 #(E7 22210101010 210
1HVWHPRPHQWRSRGHPRVYROWDUDRTXHVWLRQDPHQWRJHUDGRORJRGHSRLV da apresentação do Exemplo 2.3, ou seja, se considerarmos B {0,1`descobrir, VHPWHUTXHOLVWDULVVRVHULDPXLWRGHVSHQGLRVR TXDOVHUiDFDUGLQDOLGDGHGHBn. Esse problema pode ser resolvido de maneira similar ao problema das senhas, XPD YH] TXH FDGD YHWRU GR FRQMXQWR Bn pode ser encarado como um senha de n dígidos formada a partir do conjunto B ,VVR VLJQLÀFD TXH R SUREOHPD SRGH VHU UHVROYLGR HP Q HWDSDV LQGHSHQGHQWHV HP TXH FDGD HWDSD HQYROYH D escolha de um número para ocupar uma entrada do vetor. Assim, pelo princípio multiplicativo de contagem,
Em particular, #(B 2, #(B 2 e #(B0 20.
Dados dois conjuntos A e BWDLVTXH ABGL]HPRVTXHHVVDLQFOXVmRpSUySULDTXDQGRAB, LVWRpTXDQGRH[LVWHSHORPHQRVXPHOHPHQWRGHBTXHQmRSHUWHQFHDA.
Série Novos Autores da Educação Profissional e Tecnológica
61
62
Capítulo II - Noções de contagem
2XWUD VLWXDomR EDVWDQWH FRPXP QD PRGHODJHP GH SUREOHPDV GH FRQWDJHP p TXDQGR R SUREOHPD GHYH VHU UHVROYLGR HP etapas mutuamente exclusivas. Para facilitar a compreensão, acompanhe o exemplo abaixo. Exemplo 2.4. Ao final de uma corrida, um ciclista está sedento. Resolve, então, passar numa lanchonete para matar a sede. A lanchonete oferece 3 marcas de água, 5 tipos de suco e 4 marcas de refrigerante, e o dinheiro que o ciclista possui lhe permite fazer uma única escolha. Analisando o Exemplo 2.4pIiFLOFRQFOXLUTXHRFLFOLVWDWHPPDQHLUDV distintas de resolver o seu problema. Apesar da simplicidade do exemplo, SRGHPRVH[SORUiORDÀPGHUHÀQDUQRVVDPDQHLUDGHSODQHMDUDFRQWDJHPGH HOHPHQWRVGHXPFRQMXQWRTXDOTXHUHPVLWXDo}HVPDLVJHUDLV 9DPRVSHQVDUSRUHWDSDV5HVROYHURSUREOHPDGRFLFOLVWDVLJQLÀFD (E1 HVFROKHUXPWLSRGHiJXD (E2) escolher um tipo de suco ou (E) escolher um tipo de refrigerante.
1RHQWDQWRHVVDVHWDSDVVmRPXWXDPHQWHH[FOXVLYDVRTXHVLJQLÀFDGL]HU TXHDUHDOL]DomRGHXPDH[FOXLDUHDOL]DomRGDVRXWUDV(PVLWXDo}HVFRPRHVVD para efetuar a contagem do número de possibilidades, utilizamos o princípio DGLWLYRGHFRQWDJHPHQXQFLDGRDEDL[R 'HÀQLomR35,1&Ì3,2$',7,92'(&217$*(0 6HXPSUREOHPDSRGH ser resolvido em n etapas E1, E2, , En PXWXDPHQWH H[FOXVLYDV HP TXH #(Ei representa o número de maneiras distintas de se resolver a Etapa Ei, i = 1,2,,n , então o conjunto ƺGHWRGDVPDQHLUDVGLVWLQWDVGHVHUHVROYHURSUREOHPDpWDOTXH #ƺ #(E1 +#(E2 ++#(En .
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
Nesse ponto da discussão, chamamos a atenção para a relação dos FRQHFWLYRV ´Hµ H ´RXµ TXH DSDUHFHP QDWXUDOPHQWH QD LQWHUSUHWDomR GRV SUREOHPDV H QD HVTXHPDWL]DomR GDV HWDSDV GH FRQWDJHP FRP RV SULQFtSLRV IXQGDPHQWDLV GH FRQWDJHP 2 SULPHLUR HVWi UHODFLRQDGR DR SULQFtSLR PXOWLSOLFDWLYRHQTXDQWRTXHRVHJXQGRDRSULQFtSLRDGLWLYR 2VHJUHGRGHVHUHDOL]DUFRUUHWDPHQWHDFRQWDJHPGRVHOHPHQWRVGHXP FRQMXQWRHVWiQDFRPSUHHQVmRGRIRUPDWRGRHOHPHQWRTXHGHVHMDPRVFRQWDU HQDHODERUDomRGHXPURWHLURTXHVHOLPLWHDDSOLFDURVSULQFtSLRVIXQGDPHQWDLV de contagem acima enunciados. Exemplo 2.5. A partir do conjunto M {0,1,,`, quantas senhas de 4 dígitos podemos formar, de modo que comecem com número ímpar ou terminem com um número par? No Exemplo 2.5, podemos considerar os conjuntos P {VHQKDVGHTXDWURGtJLWRVTXHFRPHoDPFRPQ~PHURtPSDU` e Q {VHQKDVGHTXDWURGtJLWRVTXHWHUPLQDPFRPQ~PHURSDU` 2EVHUYHTXHTXHUHPRVGHVFREULUDFDUGLQDOLGDGHGRFRQMXQWRP Q, e o SUREOHPDHVWDUiUHVROYLGRTXDQGRUHVSRQGHUPRVjVVHJXLQWHVTXHVW}HV 4XDQWDVVHQKDVGHGtJLWRVSRGHPRVIRUPDUDSDUWLUGRVHOHPHQWRV GH0TXHFRPHoDPFRPQ~PHURtPSDU" 4XDQWDVVHQKDVGHGtJLWRVSRGHPRVIRUPDUDSDUWLUGRVHOHPHQWRV GH0TXHWHUPLQDPFRPQ~PHURSDU" 4XDQWDVVHQKDVGHGtJLWRVSRGHPRVIRUPDUDSDUWLUGRVHOHPHQWRV GH0TXHFRPHoDPFRPQ~PHURtPSDUHWHUPLQDPFRPQ~PHURSDU"
Série Novos Autores da Educação Profissional e Tecnológica
63
64
Capítulo II - Noções de contagem
,VWRSRUTXHRVFRQMXQWRVP e Q não são disjuntos (eventos mutuamente H[FOXVLYRV ORJRGHYHPRVID]HUDVHJXLQWHFRQWD #(P Q #P + #Q – #(P Q
3HUFHEDTXHGLPLQXLUDTXDQWLGDGH#(P Q na Equação 2.4 corresponde DGHVFRQWDURVHOHPHQWRVTXHIRUDPFRQWDGRVGXDVYH]HV 3URFHGDPRV HQWmR DR FiOFXOR GDV TXDQWLGDGHV #P, #Q e #(P Q . /HPEUHPRQRVGHTXHHVWDPRVWUDEDOKDQGRQRXQLYHUVRGHVHQKDVYHWRUHV FRP 4 entradas, isto é, estamos olhando para elementos da forma (x1, x2, x, x , com xiM, i 1,,3DUDRFiOFXORGH#PGHYHPRVSHUFRUUHUDVVHJXLQWHVHWDSDV (E1) escolha de um elemento x1 para a ocupação da primeira entrada da senha, entre os elementos de {1,,,7,`; (E2) escolha de um elemento x2 para a ocupação da segunda entrada da senha, entre os elementos de M; (E) escolha de um elemento x para a ocupação da terceira entrada da senha, entre os elementos de M; (E) escolha de um elemento xSDUDDRFXSDomRGDTXDUWDHQWUDGDGD senha, entre os elementos de M; Como as etapas E1,,E são independentes, pelo princípio multiplicativo GHFRQWDJHPWHPRVTXH #P 10 'HIRUPDDQiORJD #Q 10H#(P Q 2102 Finalmente, pela Equação 2.4WHPRVTXH #(P Q 10+10²2102 700
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
Portanto, dado o conjunto ƺ {VHQKDVGHTXDWURGtJLWRVIRUPDGDVDSDUWLUGRFRQMXQWR0`, acabamos de contar os elementos do subconjunto ƭ ƺ, cujos elementos DSUHVHQWDPDFDUDFWHUtVWLFDGHVFULWDDEDL[R ƭ {sƺs FRPHoDSRUQ~PHURtPSDURXWHUPLQDSRUQ~PHURSDU` $ SUy[LPD VHomR GHGLFDVH D UHVSRQGHU D RXWUD TXHVWmR JHUDO IHLWD QR início deste capítulo.
2 Contando elementos no conjunto das partes de um conjunto com cardinalidade finita 1RLQtFLRGHVWHFDStWXOROHYDQWDPRVXPTXHVWLRQDPHQWRJHUDOPRWLYDGRV pela situação apresentada no Exemplo 2.2 FRPR FRQWDU D TXDQWLGDGH GH VXEFRQMXQWRVGHXPFRQMXQWRGDGRTXHSRVVXHPXPDGHWHUPLQDGDFDUGLQDOLGDGH Considere, inicialmente, o conjunto ƺ0 {a, b, c`7HPRVTXH#(ƺ0 . Nesse caso, conseguimos listar todos os elementos de (ƺ0 , o conjunto dos subconjuntos de ƺ0 (ƺ0 {Ø,{a`, {b`, {c`,{a,b`,{a,c`,{b,c`,{a,b, c`` 1RWHTXHRVHOHPHQWRVGH(ƺ0 VmRFRQMXQWRVHTXH#((ƺ0 , isto é, o número total de conjuntos elementos de (ƺ0 p$OpPGLVVRKiHP(ƺ0 XPFRQMXQWRYD]LRFRQMXQWRVFRPHOHPHQWRFRQMXQWRVFRPHOHPHQWRV HFRQMXQWRFRPHOHPHQWRV $ SDUWLU GH DJRUD FRQVLGHUH XP FRQMXQWR ÀQLWR ƺ TXDOTXHU FRP Q elementos. Denotaremos por R Q~PHUR GH VXEFRQMXQWRV TXH SRGHPRV formar a partir dos elementos de ƺFRPH[DWDPHQWHSHOHPHQWRVHPTXHSp XPQ~PHURLQWHLURPDLRURXLJXDODHPHQRURXLJXDODQ
Série Novos Autores da Educação Profissional e Tecnológica
65
66
Capítulo II - Noções de contagem
Exemplo 2.6. Se considerarmos o conjunto ƺ0 do início desta seção, então é a quantidade de subconjuntos de ƺ0 que possuem exatamente o número = 3. elementos, isto é, (VWDEHOHFLGDHVVDQRWDomRpSUHFLVRDJRUDGHVFREULUTXHQ~PHURQDWXUDO HVWiDVVRFLDGRDFDGD . Nesse sentido, precisamos de uma noção ainda não apresentada até agora, a de fatorial de um número natural. 'HÀQLomR'DGRXPQ~PHURQDWXUDOQGHÀQLPRV 0 1 1 e n 12(n²1 n,n2 $H[SUHVVmR´QµOrVH´QIDWRULDOµRX´IDWRULDOGHQµ (VVD GHÀQLomR QRV SHUPLWLUi DFHOHUDU DOJXPDV FRQWDV QRV SURFHVVRV GH FRQWDJHP'HODpSRVVtYHOFRQFOXLULPHGLDWDPHQWHTXH n n (n²1 n (n²1 (n²2 : n (n²1 21
HTXH 6HPSUHTXHm n. 2SUy[LPRH[HPSORLOXVWUDRXVRGHVVDVSURSULHGDGHV Exemplo 2.7. Pela Propriedade (2.5), temos que
e, pela Propriedade (2.6),
2EVHUYHTXHSDUDTXDOTXHUn dado, n! é um número natural.
Série Novos Autores da Educação Profissional e Tecnológica
67
Probabilidade e Estatística: um curso introdutório
eFRPXPQDOLWHUDWXUDTXHWUDWDGHSUREOHPDVGHFRQWDJHPDGHQRPLQDomR GHDUUDQMRSDUDGHVLJQDUYHWRUHVVHPHOHPHQWRVUHSHWLGRV1mRIDUHPRVDTXLXVR desta terminologia. A proposição abaixo apresenta uma contagem para vetores TXHDSUHVHQWDPHVVDFDUDFWHUtVWLFD Proposição 2.1. Seja ƺ um conjunto tal que #ƺ n. Então a quantidade . de vetores de ƺS, 0pn, que possui todas as coordenadas distintas, é Demonstração:'HIDWRTXHUHPRVFRQWDUYHWRUHVTXHWHQKDPRVHJXLQWH IRUPDWR (w1,w2,,wp ,RQGHwi wj,i, j 1,2,,p Assim, para a escolha de w1 temos n possibilidades, para a escolha de w2 temos n²p + 1 possibilidades, e assim por adiante, até a escolha de wp, HPTXHWHUHPRVn²1 possibilidades. Aplicando o princípio multiplicativo de contagem, teremos
SRVVLELOLGDGHVGHYHWRUHVFRPDVHVSHFLÀFDo}HVGHVHMDGDV $ TXHVWmR TXH VH FRORFD p D GH FRPR GHWHUPLQDU D TXDQWLGDGH GH subconjuntos de ƺTXHSRVVXHPH[DWDPHQWHSHOHPHQWRV,VWRpGLVSRPRVGH QHOHPHQWRVHTXHUHPRVIRUPDUDJUXSDPHQWRVFRPH[DWDPHQWHSGHOHVWRGRV GLVWLQWRV6HSHQVDUPRVHPYHWRUHVMiYLPRVTXHFRQVHJXLUtDPRVFULDU . Mas isso não responde ao nosso problema, pois estamos falando de elementos TXHVmRFRQMXQWRVHQmRYHWRUHV Como vimos, os vetores (x1,x2,x,,xp e (x2,x1,x,,xp são distintos, HQTXDQWRTXHRVFRQMXQWRV^x1,x2,x,,xp} e {x2,x1,x,,xp} são iguais. Por essa razão, o número pPDLRUGRTXHRTXHTXHUHPRVXPDYH]TXHFRUUHVSRQGH jTXDQWLGDGHGHYHWRUHVFRPRIRUPDWRGHVHMDGR3DUDLVVRSUHFLVDPRVGHVFRQWDU
Série Novos Autores da Educação Profissional e Tecnológica
68
Capítulo II - Noções de contagem
todas as possíveis permutações. Fazendo isso, é como se estivéssemos eliminando RVFRQMXQWRVLJXDLVTXHIRUDPFRQWDGRVFRPRGLIHUHQWHV 'HÀQLomR Dados dois vetores v (v1,v2,,vk e w (w1,w2,,wk pertencentes a um conjunto ƺkGLUHPRVTXHv é uma permutação de w, ou YLFHYHUVDVHDVHQWUDGDVGRYHWRUv forem as mesmas entradas do vetor w, a menos de ordem. &RPR H[HPSOR R YHWRU p XPD SHUPXWDomR GR YHWRU 0DLVJHUDOPHQWHSRGHPRVFRQVLGHUDUDVHJXLQWHSURSRVLomR Proposição 2.2. Considere o conjunto ƺp. Se w ƺp é um vetor com todas as entradas distintas, então w admite p! permutações. Demonstração: De fato, a partir dos elementos do conjunto A (w1,w2,,wp , formado pelas entradas do vetor w, desejamos construir uma permutação de w, isto é, um novo vetor v (v1,v2,,vp TXHUHVXOWHGRHPEDUDOKDPHQWRGDV entradas de w. Temos, assim, p maneiras distintas de escolher v1, a primeira entrada de v, p ²1 maneiras distintas de escolher v2, a segunda entrada de v, e DVVLPSRUGLDQWHDWpTXHSDUDDHVFROKDGHvpDSpVLPDHQWUDGDGHv, teremos XPD~QLFDPDQHLUDGHID]rOR8WLOL]DQGRRSULQFtSLRPXOWLSOLFDWLYRGHFRQWDJHP FRQFOXtPRVTXHKip! maneiras distintas de fazer o serviço. 1RWHTXHD3URSRVLomRpXPFDVRSDUWLFXODUGD3URSRVLomR 5HWRUQDQGR j TXHVWmR FHQWUDO GHVWD VHomR TXDO VHMD D FRQWDJHP GD TXDQWLGDGHGHVXEFRQMXQWRVGHXPFRQMXQWRTXHSRVVXHPXPGDGDFDUGLQDOLGDGH EDVWDGLYLGLUDTXDQWLGDGHGHYHWRUHVSHODTXDQWLGDGHGHFySLDVSHUPXWDGDVGH FDGDYHWRU2UHVXOWDGRSRGHVHULQWHUSUHWDGRFRPRDTXDQWLGDGHGHVHMDGDLVWRp
Acabamos, assim, de demonstrar a Proposição 2.3. Dado um conjunto ƺ com n elementos, o número de subconjuntos de ƺTXHSRVVXHPH[DWDPHQWHp elementos é dado pela expressão
Série Novos Autores da Educação Profissional e Tecnológica
69
Probabilidade e Estatística: um curso introdutório
(VVDSURSRVLomRUHVSRQGHjTXHVWmROHYDQWDGDQRLQtFLRGHVWDVHomR(P SDUWLFXODUDUHVSRVWDSDUDDTXHVWmRSRVWDQR([HPSORpRQ~PHUR
3 Números combinatórios Na seção anterior, aprendemos a calcular o valor do número TXHDWp HQWmRQDGDPDLVHUDTXHXPDQRWDomRSDUDRQ~PHURGHVXEFRQMXQWRVFRPp elementos formados a partir de um conjunto de n elementos. Números assim, GHÀQLGRVDWUDYpVGD(TXDomRVmRFKDPDGRVGHQ~PHURVFRPELQDWyULRV ou combinações. 2VQ~PHURVFRPELQDWyULRVDSUHVHQWDPHQWUHVLLPSRUWDQWHVSURSULHGDGHV $VHJXLUOLVWDPRVDVSULQFLSDLVGHODV , para todo n N.
Propriedade 2.1.
Demonstração: De fato,
para todo 0pn.
&RPRFDVRVSDUWLFXODUHVGD3URSULHGDGHWHPRV
e, de volta ao conjunto ƺ0 apresentado no início desta Seção,
Série Novos Autores da Educação Profissional e Tecnológica
70
Capítulo II - Noções de contagem
isto é, ƺ0 SRVVXL WUrV VXEFRQMXQWRV FRP H[DWDPHQWH GRLV HOHPHQWRV H WUrV subconjuntos com exatamente um elemento. Propriedade 2.2. (Relação de Stiffel) Para todo n N, temos
Demonstração: De fato,
para todo 0dpdn.
$ 3URSULHGDGH D VHJXLU VHUi GH IXQGDPHQWDO LPSRUWkQFLD SDUD MXVWLÀFDUPRV D DÀUPDomR TXH À]HPRV QD 6HomR VREUH D FDUGLQDOLGDGH GR FRQMXQWRGDVSDUWHVGHXPFRQMXQWRÀQLWR
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
3DUDEHPFRPSUHHQGrODHQWUHWDQWRWRUQDVH~WLOLQWURGX]LUDQRomRGH VRPDWyULRTXHQDGDPDLVpTXHXPDQRWDomRSDUDUHSUHVHQWDUVRPDVHQYROYHQGR XPD TXDQWLGDGH LQXPHUiYHO GH SDUFHODV SDUWLFXODUPHQWH ~WLO TXDQGR OLGDPRV com somas envolvendo muitas parcelas. Para isso, considere x (x1,x2,,xn um vetor carregando n informações QXPpULFDVTXDLVTXHUQmRQHFHVVDULDPHQWHGLVWLQWDV5HSUHVHQWDUHPRVDVRPD
1D ([SUHVVmR XVDPRV D OHWUD JUHJD PDL~VFXOD sigma SDUD UHSUHVHQWDUGHIRUPDFRPSDFWDDVRPD1DSDUWHLQIHULRUGHHQFRQWUDVH um contador (no caso, representado pela letra i TXHYDULDGHDWpn, indicando TXHWRGRVRVQ~PHURVDFRPHoDUGDTXHOHTXHVHHQFRQWUDQDHQWUDGDDWpR TXHVHHQFRQWUDQDHQWUDGDn do vetor x, devem ser somados. A expressão xi é uma representação genérica da informação constante da entrada i, 1 d i d n, do vetor x'L]HPRVTXHHVVDH[SUHVVmRpRsomando da soma.3 Exemplo 2.8. Considere um vetor y (y1,y2,,y10 , tal que yj 2j, para todo j 1,2,,10. Então,
e
Propriedade 2.3. Para todo n N,
3
(VVDH[SUHVVmRFRPSDFWDGDVRPDFRVWXPDVHUGHQRPLQDGDGHVRPDWyULR/rVHDH[SUHVVmRDVVLP somatório de xi, iYDULDQGRGHDWpn.
Série Novos Autores da Educação Profissional e Tecnológica
71
72
Capítulo II - Noções de contagem
Demonstração: Para a demonstração dessa propriedade, usaremos um argumento chamado de indução. Para n 0WHPRVTXH
6XSRQKDTXHDSURSULHGDGHVHMDYHUGDGHLUDSDUDn k, isto é,
0RVWUDUHPRVTXHVREHVVDKLSyWHVH4DSURSULHGDGHVHUiYiOLGDSDUDRFDVRn k +1. De fato,
)LFDDVVLPSURYDGRTXHDSURSULHGDGHpYiOLGDSDUDWRGRn N.
4
Essa hipótese é também conhecida como KLSyWHVHGHLQGXomR.
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
1DGHPRQVWUDomRGD3URSULHGDGHIRLQHFHVViULRRXVRGDVSURSULHGDGHV HDOpPGHDOJXPDVPDQREUDVDOJpEULFDVSDUDTXHÀFDVVHFODURRXVRGD KLSyWHVHGHLQGXomR&RPRFRQVHTXrQFLDLPHGLDWDGHVVDVSURSULHGDGHVWHPRV Proposição 2.4. Se ƺ é um conjunto de cardinalidade n, então a cardinalidade do conjunto (ƺ é 2n. Demonstração: Como o conjunto (ƺ é formado por todos os subconjuntos de ƺ HQWmR EDVWD FDOFXODUPRV D TXDQWLGDGH GH VXEFRQMXQWRV com cardinalidades 0,1,,nHDVRPDGHVVDVTXDQWLGDGHVVHUiRQ~PHURGH elementos do conjunto (ƺ $VVLPSHOD3URSULHGDGHWHPRVTXH
(pSRUHVVDUD]mRTXHWDPEpPXVDPRVDH[SUHVVmR2ƺ para designar o conjunto (ƺ TXDQGRƺSRVVXLFDUGLQDOLGDGHÀQLWD
Exercícios 8P FRQMXQWR ƺ SRVVXL HOHPHQWRV 4XDQWRV VXEFRQMXQWRV GH ƺ SRVVXHPH[DWDPHQWHHOHPHQWRV"
D E F G H
,)* 4XDQWRV Q~PHURV GH TXDWUR DOJDULVPRV GLVWLQWRV PDLRUHV TXH VHSRGHIRUPDUFRPRVDOJDULVPRVH"
D E F G H
Série Novos Autores da Educação Profissional e Tecnológica
73
74
Capítulo II - Noções de contagem
&HVSH8Q% $ TXDQWLGDGH GH DQDJUDPDV TXH SRGHP VHU IRUPDGRV FRP D SDODYUD &87,$ H TXH FRPHoDP H WHUPLQDP FRP FRQVRDQWH p igual a
D E F G
&HVSH8Q% 8PD HVFROD SRVVXL SURIHVVRUHV GH PDWHPiWLFD GH FLrQFLDV H GH SRUWXJXrV $ GLUHomR GD HVFROD SUHWHQGH FRORFDU R comando de uma excursão para seus alunos a um grupo formado por SURIHVVRUHVGHPDWHPiWLFDGHFLrQFLDVHGHSRUWXJXrV1HVWH FDVRDTXDQWLGDGHGHJUXSRVGLVWLQWRVGHSURIHVVRUHVTXHSRGHUmRVHU formados para comandar a excursão é igual a
D E F G
&HVSH8Q% 6DEHQGRTXH21 1, então o somatório é
D E F G
$ TXDQWLGDGH GH DQDJUDPDV GLVWLQWRV TXH VH SRGH IRUPDU FRP D palavra AMBIENTE é igual a
D E F G
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
2Q~PHURGHDQDJUDPDVGDSDODYUD0$7(0É7,&$TXHFRPHoDPSRU consoante é
D E F G H
Série Novos Autores da Educação Profissional e Tecnológica
75
CAPÍTULO III ANÁLISE EXPLORATÓRIA DE DADOS
Probabilidade e Estatística: um curso introdutório
Análise exploratória de dados
(VWXGDUHPRVQHVWHFDStWXORDOJXPDVPHGLGDVTXHSRGHPVHUDVVRFLDGDV DFRQMXQWRVRXDYHWRUHVTXHFDUUHJDPLQIRUPDo}HVTXHGHDOJXPDPDQHLUD dão ideia do seu comportamento global. Essa ideia de comportamento também SRGHVHUFDSWXUDGDDSDUWLUGHXPROKDUDWHQFLRVRSDUDRVLQVWUXPHQWRVJUiÀFRV comumente utilizados para representar e comunicar essas informações. 5HFRUGHPRVTXHFRQIRUPHGHÀQLGRQR&DStWXORVHx (x1,x2,,xk um vetor carregando k dados numéricos, então
e podemos adaptar todas as propriedades usuais da soma para essa notação. (VVDQRWDomRVHUiSDUWLFXODUPHQWH~WLOSDUDTXHSRVVDPRVQRVH[SUHVVDU de forma compacta.
Série Novos Autores da Educação Profissional e Tecnológica
79
80
Capítulo III - Análise exploratória de dados
$VHJXLULQWURGX]LUHPRVDOJXPDVPHGLGDVTXHDSUHVHQWDPLQIRUPDo}HV resumidas de um conjunto ou de um vetor de dados. Essas medidas isoladamente não dizem muito, mas podem se tornar valiosos instrumentos para o trabalho HVWDWtVWLFRTXHLQWURGX]LUHPRVQR&DStWXOR
1 Medidas resumo 4XDQGR OLGDPRV FRP XP FRQMXQWR ÀQLWR GH LQIRUPDo}HV PXLWDV YH]HV QHFHVVLWDPRV GH XPD PHGLGD TXH DV UHVXPD 1XPD HVFROD SRU H[HPSOR p XPD SUiWLFD FRPXP jV YH]HV XPD QHFHVVLGDGH SURFXUDU VDEHU FRPR HVWi R DSURYHLWDPHQWR GRV VHXV HVWXGDQWHV 2 JHUHQWH GH XPD SDGDULD QXP RXWUR H[HPSOR SRGH HVWDU HP G~YLGD VREUH TXDLV DV TXDQWLGDGHV TXH GHYHP VHU produzidas de cada pão produzido e comercializado ali. 1RFDStWXORDQWHULRUYLPRVTXHDFDUGLQDOLGDGHpXPDPHGLGDTXHSRGH VHUDVVRFLDGDDFRQMXQWRVGLVFUHWRVHTXHFRQWDDYDULHGDGHGHLQIRUPDomRDOL presente. Dependendo da estrutura do conjunto, outras medidas podem ser DVVRFLDGDVDHOHSRUH[HPSORDVPHGLGDVGHFRPSULPHQWRGHiUHDHGHYROXPH Todas essas medidas permitem a comparação de um conjunto com outros de mesma natureza. 1R TXH VHJXH DSUHVHQWDPRV DOJXPDV PHGLGDV HVWDWtVWLFDV FOiVVLFDV TXH SRVVLELOLWDP D FRPSDUDomR HQWUH FRQMXQWRV GH LQIRUPDo}HV DV FKDPDGDV medidas resumo7UDWDVHGHQ~PHURVTXHDVVRFLDPRVDRVFRQMXQWRVHTXHGH alguma maneira, descrevem o comportamento global de seus elementos. &ODVVLÀFDPRVDVPHGLGDVUHVXPRHPGRLVJUXSRVDVPHGLGDVGHposição e as medidas de dispersão. Nas próximas subseções, detalharemos as medidas mais conhecidas de cada um desses grupos.
1.1 Medidas de posição Das medidas de posição, a mais conhecida de todas é a média.
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
'HÀQLomR Seja X XP FRQMXQWR GH FDUGLQDOLGDGH ÀQLWD LVWR p X {x1, x2, ..., xn` 'L]HPRV TXH D PpGLD dos elementos de X é o número x GHÀQLGRSRU
Em outras palavras, calcular o número médio de um conjunto numérico ÀQLWRVLJQLÀFDFROKHUWRGDDLQIRUPDomRWUD]LGDSHORVHOHPHQWRVGRFRQMXQWRH distribuir uniformemente essa informação para todos os elementos do conjunto. (VVD GLVWULEXLomR XQLIRUPH ÀFD FDUDFWHUL]DGD QD (TXDomR SHOD GLYLVmR GR conjunto da informação pela cardinalidade do conjunto X. 1R HQWDQWR TXDQGR WUDEDOKDPRV FRP XP FRQMXQWR GH GDGRV TXH eventualmente se repetem, a cardinalidade do conjunto tende a perder o sentido QRFiOFXORGDPpGLDXPDYH]TXHFDGDHOHPHQWRDVVXPHXPDLPSRUWkQFLDRX SHVRGLIHUHQFLDGRGLDQWHGRVGHPDLV1HVVDVLWXDomRpIXQGDPHQWDOTXHHPYH] GHWUDEDOKDUFRPRFRQMXQWRTXHUHSUHVHQWDRVGDGRVGLVSRQtYHLVWUDEDOKHPRV com o rol desses dados. 'HÀQLomR Considere o vetor x = (x1, x2, ..., xk TXHFDUUHJDRVGDGRV UHVXOWDQWHVGDREVHUYDomRGHDOJXPIHQ{PHQR'LUHPRVTXHRUROGHVVHVGDGRV é o vetor = (x(1 , x(2 , ..., x(k WDOTXHSDUDWRGR1 d i d kWHPVHx(i = xj para algum 1 d j d k e, além disso, ocorre x(1 d x(2 d ... d x(k 2XVHMDXPUROpXPDOLVWDRUGHQDGDGHWRGRVRVUHVXOWDGRVGDREVHUYDomR GHDOJXPIHQ{PHQRDLQGDTXHUHSHWLGRV Exemplo 3.1. A fim de melhorar a produção de leite bovino, um fazendeiro deseja suplementar a alimentação das suas matrizes leiteiras. Antes, contudo, observou a quantidade produzida por suas 9 matrizes num determinado dia . O vetor m (m1, m2, ..., m (,,7,12,,,,7,10 é o resultado do
$PpGLDDSUHVHQWDQHVWDGHÀQLomRWDPEpPpFRQKHFLGDFRPRmédia aritmética.
Série Novos Autores da Educação Profissional e Tecnológica
81
82
Capítulo III - Análise exploratória de dados
processo de coleta, em que mi representa a quantidade de litros colhidos na matriz do piquete i. O correspondente rol dessa situação será o vetor ordenado ~ ~ ~ ~ m (m1, m2, ..., m (m(1 , m(2 , ..., m( (,,,7,7,,10,12 . Qual a produção média de leite daquele dia? 1R H[HPSOR FLWDGR SRGHUtDPRV GL]HU TXH R FRQMXQWR GDV TXDQWLGDGHV SURGX]LGDV SHODV PDWUL]HV OHLWHLUDV GR ID]HQGHLUR QDTXHOH GLD VHULD ^ ` HP TXH DV TXDQWLGDGHV VmR GDGDV HP OLWURV (VVH FRQMXQWR PRVWUD D GLYHUVLGDGHGHUHVXOWDGRVGDVREVHUYDo}HVIHLWDV$ÀPGHFDOFXODUDPpGLDGD SURGXomR QmR SRGHUtDPRV VLPSOHVPHQWH XWLOL]DU D IyUPXOD XPD YH] TXH temos informações adicionais sobre a frequência FRP TXH FDGD XP GHVVH elementos apareceu no processo de coleta de dados. Para resolver esse problema, p VHQVDWR DSOLFDU R PHVPR UDFLRFtQLR GD IyUPXOD SRUpP FRQVLGHUDQGR RV elementos do rol. Procedendo assim, a média mVHUi
$VVLPSRGHPRVUHÀQDUQRVVRFRQFHLWRGHPpGLD 'HÀQLomR Seja XXPFRQMXQWRÀQLWRTXHUHSUHVHQWDDYDULHGDGHGH informação num processo de coleta de dados, isto é, X {x1, x2, ..., xn`HPTXH cada elemento xiSRVVXLXPDIUHTXrQFLDfiQRUROTXHFRQWpPDVLQIRUPDo}HVGR processo. Então, a média x é dada por (3.3)
$'HÀQLomRpPDLVJHUDOTXHD'HÀQLomRSRLVOHYDHPFRQVLGHUDomR o peso de cada elemento na totalidade da informação. Por essa razão, a média obtida por esse processo é também conhecida como média ponderada.
Entenderemos por frequênciaRQ~PHURGHYH]HVTXHXPGDGRDSDUHFHQXPUROGHLQIRUPDo}HV
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
$ÀPGHHYLWDUFRQIXV}HVUHODFLRQDGDVDRFRQFHLWRGHPpGLDSRGHPRV GHÀQLODVLPSOHVPHQWHDVVLP 'HÀQLomR Seja x (x1, x2, ..., xn um vetor de informações obtidas de XPSURFHVVRGHFROHWDGHGDGRV'HÀQHVHDPpGLDx como sendo
7DOFRPRQD'HÀQLomRDPpGLDQD'HÀQLomROHYDHPFRQVLGHUDomR RSHVRGHFDGDLQIRUPDomRQRFiOFXORGDPpGLDQDPHGLGDHPTXHFRQVLGHUDQR VRPDQGRWRGDVDVHQWUDGDVGRYHWRUHLVVRpHTXLYDOHQWHDFRQVLGHUDURFRQMXQWR TXHUHSUHVHQWDDYDULHGDGHGHLQIRUPDo}HVHDVIUHTXrQFLDVGHVHXVUHVSHFWLYRV elementos. No Exemplo YLPRV TXH HVVD PHGLGD UHVXPR SRGH VHU REWLGD analisando o rol das observações do processo. E é também observando o rol TXH GHÀQLUHPRV RXWUDV LPSRUWDQWHV PHGLGDV GHVFULWRUDV GR FRPSRUWDPHQWR FRQMXQWRGDVREVHUYDo}HVDmediana e a moda. 'HÀQLomR'L]HPRVTXHDPHGLDQDGHXPUROGHGDGRVx (x(1 , x(2 , ..., x(k pDPHGLGDTXHFHQWUDOL]DRUROLVWRpTXDOTXHUQ~PHURxmedWDOTXH xmed d 0GRVGDGRVHxmed t0GRVGDGRV &RPRFRQVHTXrQFLDGHVVDGHÀQLomRSRGHPRVWHU
como uma mediana para o rol x. ~ m ~ 7é o valor mediano Exemplo 3.2. No Exemplo 3.1, o número m med ( do vetor ~ m, que representa a quantidade de leite produzido por matriz num dia fixado. Isso significa que metade das observações são de quantidades menores ou iguais a 7 e metade são de quantidades maiores ou iguais a 7.
Série Novos Autores da Educação Profissional e Tecnológica
83
84
Capítulo III - Análise exploratória de dados
)UHTXHQWHPHQWHHPYH]GHGLYLGLURUROHPGRLV´SHGDoRVµGHPHVPR WDPDQKR Ki R LQWHUHVVH HP GLYLGLOR HP TXDWUR RX HP GH] RX HP TXDQWRV pedaços forem. Exemplo 3.3. Comunicadas as notas de 5 jurados sobre um dado quesito, o regulamento da apuração do desfile das escolas de samba de São Paulo em 2010 ordenava o descarte da menor e da maior nota. Pelas regras, um quesito que recebeu um rol de notas z (,,,7,10,10,10 terá as notas z(1 , e z( 10 descartadas. Isto é, a informação carregada pelo vetor ordenado foi dividida em 5 partes e, só depois do refinamento das notas, foi considerada na apuração do resultado final. 0HGLGDVTXHFRPRDPHGLDQDGLYLGHPDLQIRUPDomRGRUROHPSDUWHV iguais são chamadas de separatrizes. 'HÀQLomR Seja x (x(1 , x(2 , ..., x(k XPUROTXDOTXHUGHLQIRUPDo}HV$V medidas Q1,Q2,,Qn são chamadas de separatrizes de x se
Em particular, os quartis Q1,Q2 e QVmRVHSDUDWUL]HVTXHFRPRRSUySULR nome sugere, dividem as informações em 4 blocos de mesmo tamanho. Para ID]HULVVRSURFHGHPRVGHPDQHLUDDQiORJDDRTXHÀ]HPRVQDGHWHUPLQDomRGD mediana. Exemplo 3.4. O vetor d (,2,,,2,1,7,1,,,1,,2,1,,1,,2,7 , que carrega a informação sobre os diâmetros da cabeça de um parafuso numa ~ determinada linha de produção, possui como rol o vetor d (1,7,1,,1,,1,, 2,,2,7,,,1,,2,,2 . Os três quartis Q1,Q2 e Q são dados por:
e
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
)LQDOPHQWHDSUHVHQWDPRVDGHÀQLomRGHPRGD 'HÀQLomR Dado um vetor de informações x (x1, x2, ..., xk , dizemos TXHDPRGDxmo de xpDLQIRUPDomRGHPDLRUIUHTXrQFLDLVWRpDLQIRUPDomR TXHPDLVVHUHSHWH ~ Exemplo 3.5. No Exemplo 3.1, a moda é o número m . mo
1.2 Medidas de dispersão Embora as medidas de posição sejam os primeiros descritores numéricos DSOLFDGRV D XP YHWRU TXH FDUUHJD GHWHUPLQDGD LQIRUPDomR HODV QHP VHPSUH JDUDQWHPXPDERDUHSUHVHQWDWLYLGDGHGHOH,VVRSRUTXHDERDUHSUHVHQWDWLYLGDGH GHXPYHWRUHVWiGLUHWDPHQWHUHODFLRQDGDjvariabilidadeGDLQIRUPDomRTXHHOH carrega. Para maior clareza, acompanhe o exemplo seguinte. Exemplo 3.6. Numa escola, dois grupos de 4 estudantes cada um foram submetidos a metodologias distintas de apresentação de um conteúdo. Ao final do período, todos os estudantes fizeram a mesma prova sobre o assunto. Os resultados foram os seguintes: 7$%/(²127$6'2*5832$ Estudante
1
2
3
4
Nota
5
5
6
4
7$%/(²127$6'2*5832% Estudante
1
2
3
4
Nota
10
0
10
0
Se calcularmos a média e a mediana das duas turmas, essas medidas FRLQFLGLUmRIDoDDVFRQWDV ,VVRVLJQLÀFDTXHRHIHLWRGDVGXDVPHWRGRORJLDV IRLRPHVPR"
Série Novos Autores da Educação Profissional e Tecnológica
85
86
Capítulo III - Análise exploratória de dados
2 FRQKHFLPHQWR GDV PHGLGDV GH SRVLomR DSHQDV QmR QRV RIHUHFH subsídio para fazermos uma avaliação séria sobre os efeitos das metodologias DSUHVHQWDGDV+iSRLVFODUDPHQWHQD7XUPD%XPDKHWHURJHQHLGDGHTXHHVVDV medidas não foram capazes de captar, nem mesmo a comparação entre elas. 6XUJHDVVLPDQHFHVVLGDGHGHGHÀQLUQRYDVPHGLGDVFDSD]HVGHPHOKRUDUQRVVD compreensão a respeito de situações como essa. Nesse sentido, estudaremos um FRQMXQWR GH QRYDV PHGLGDV FKDPDGDV GH PHGLGDV GH GLVSHUVmR D amplitude total, o desvio médio absoluto, a variância, o desvio padrão e o FRHÀFLHQWH GH variação. 'HÀQLomR A amplitude total 'x de um vetor x é a diferença entre a maior e a menor de todas as informação contidas em suas entradas. Em particular, se o vetor for um rol x (x1, x2, ..., xk HQWmRVXDDPSOLWXGHVHUi 'x x(k – x(1 Exemplo 3.7. No Exemplo 3.1, a amplitude total do vetor m é ~ ~ ~ 'm 'm m –m 12² 7 (k (1
Isso significa que todos as informações do vetor m, consequentemente do vetor ~ não escapam de um intervalo de comprimento 7. m, (PERUD Gr XPD LGHLD GD GLVSHUVmR GDV LQIRUPDo}HV FRQWLGDV QR YHWRU a amplitude em si é pouco informativa e muito afetada por outliers ou valores H[WUHPRV ,VVR SRUTXH IRL XPD PHGLGD FRQVWUXtGD FRP EDVH DSHQDV HP GXDV informações carregadas pelo vetor. Uma maneira de contornar esse problema é pensar numa medida para TXDQWLÀFDU D GLVSHUVmR PDV TXH HQYROYD WRGD D LQIRUPDomR SDUD GHÀQLOD ( LVVR DFRQWHFH QR GHVYLR PpGLR DEVROXWR 3DUD FRPSUHHQGrOR LQLFLHPRV SHOR VLJQLÀFDGRGDSDODYUDGHVYLR Consideremos um vetor de informações x (x1, x2, ..., xk TXDOTXHU FXMD média é x'LUHPRVTXHRGHVYLRdiTXHDLQIRUPDomRxiDSUHVHQWDHPUHODomRj média x é
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
di xi²x &ODUDPHQWH YHPRV TXH R GHVYLR HP UHODomR j PpGLD VHUi QHJDWLYR VH DLQIRUPDomRWLYHUYDORUQXPpULFRPHQRUTXHDPpGLDHVHUiSRVLWLYRQRFDVR FRQWUiULR 8PIDWRLPSRUWDQWHVREUHRVGHVYLRVHPUHODomRjPpGLDpRDSUHVHQWDGR a seguir. Proposição 3.1. A soma de todos os desvios em relação à média di de um vetor de informações x (x1, x2, ..., xk é zero. Isto é,
Demonstração:'HIDWRXVDQGRDGHÀQLomRGHPpGLDHSURSULHGDGHVGR VRPDWyULRWHPRVTXH
&RPRFRQVHTXrQFLDGDSURSULHGDGHSURYDGDDFLPDRGHVYLRHPUHODomR jPpGLDQmRGiLQIRUPDomRUHOHYDQWHTXDQWRDRFRPSRUWDPHQWRFRQMXQWRGDV informações do vetor. Apesar de sua utilidade com relação ao posicionamento GHFDGDGDGRSDUWLFXODUFRPUHVSHLWRjPpGLDpSUHFLVRGHÀQLUXPDPHGLGD GH GLVSHUVmR TXH WUDGX]D FRQMXQWDPHQWH HVVH SRVLFLRQDPHQWR SDUD ÀQV GH FRPSDUDomRFRPRXWURVYHWRUHV3DUDWDQWRVHHPYH]GRGHVYLRHPUHODomRj PpGLDFRQVLGHUDUPRVDGLVWkQFLDGDLQIRUPDomRjLQIRUPDomRPpGLDLVWRpR GHVYLRDEVROXWRHPUHODomRjPpGLDGDGRSRU |di| |xi²x|, SRGHUHPRVGHÀQLURGHVYLRPpGLRDEVROXWRFRPRDVHJXLU
Série Novos Autores da Educação Profissional e Tecnológica
87
88
Capítulo III - Análise exploratória de dados
'HÀQLomR Dado um vetor de informações x (x1, x2, ..., xk , o desvio médio absoluto ĵ(x pGHÀQLGRFRPRDPpGLDGDVGLVWkQFLDVTXHFDGDLQIRUPDomR apresenta da informação média. Isto é,
Exemplo 3.8. Retornemos à situação abordada no Exemplo 3.6. Se a (,,, e b (10,0,10,0 são os vetores que carregam as informações de rendimento dos estudantes dos grupos A e B, respectivamente, então, desde que a b , temos que
e
5HSDUHTXHDVQRWDVGRJUXSR$DSUHVHQWDUDPPHQRURVFLODomRHPWRUQR GDPpGLDDRFRQWUiULRGDVQRWDVGRJUXSR%2GHVYLRPpGLRDEVROXWRFDSWDHVVH FRPSRUWDPHQWRjPHGLGDTXHVHDIDVWDGH]HUR$VVLPTXDQWRPDLVSUy[LPR de zero for o desvio médio absoluto, menor a oscilação dos dados em torno da média. Apesar dessa importante interpretação, o desvio médio absoluto apresenta GLÀFXOGDGHV GH PDQLSXODomR PDWHPiWLFD GHYLGR j SUHVHQoD GR PyGXOR (VVH IDWRGLÀFXOWDVXDXWLOL]DomRHPTXHVW}HVPDLVHODERUDGDVGD(VWDWtVWLFD Em busca de uma medida capaz de captar a dispersão dos dados em torno GD PpGLD FRP D PHVPD HÀFLrQFLD GR GHVYLR PpGLR DEVROXWR PDV TXH SRVVD RIHUHFHU PDLRUHV SRVVLELOLGDGHV GH PDQLSXODomR PDWHPiWLFD DSUHVHQWDPRV D YDULkQFLDDPDLVFRQKHFLGDGDVPHGLGDVGHGLVSHUVmR 'HÀQLomR Dado um vetor de informações x (x1, x2, ..., xk DYDULkQFLD ķ (x pGHÀQLGDFRPRDPpGLDGRVTXDGUDGRVGDGLVWkQFLDTXHFDGDLQIRUPDomR apresenta da informação média. Isto é, 2
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
Exemplo 3.9. Ainda explorando a situação apresentada no Exemplo 3.6, sendo vetores a (,,, e b (10,0,10,0 como no Exemplo 3.8, temos que
e
9HPRVTXHpSRVVtYHOLQWHUSUHWDUDYDULkQFLDDQDORJDPHQWHDRGHVYLRPpGLR DEVROXWR Mi TXH D SUR[LPLGDGH GR ]HUR LPSOLFD PHQRU YDULDELOLGDGH 7RGDYLD D HVFDOD GHVVDV PHGLGDV ÀFD DOWHUDGD 'H IDWR SRGHPRV QRWDU TXH ĵ(b SRQWRVHQTXDQWRTXHķ2(b SRQWRVDRTXDGUDGR,VVRSRUVLVyQmRUHSUHVHQWD SUREOHPDVXPDYH]TXHHVVDVPHGLGDVVmRVLJQLÀFDWLYDVHPFRPSDUDomRFRP RXWURYHWRUGHLQIRUPDo}HVVLPLODUHV1RHQWDQWRRXVRGDYDULkQFLDDSHVDUGH muito comum, gera um desconforto por distorcer as escalas. No caso em tela, é FRPSOLFDGRDWULEXLUXPVHQWLGRjHVFDOD´SRQWRDRTXDGUDGRµ 3HODVUD]}HVDSUHVHQWDGDVGHÀQLPRVRGHVYLRSDGUmRFRPRVHQGRDUDL] TXDGUDGDGDYDULkQFLD'HVVDIRUPDRGHVFRQIRUWRJHUDGRSHODHVFDODGLVWRUFLGD GHVDSDUHFHHDWUDWDELOLGDGHPDWHPiWLFDSHUPDQHFHMXQWRFRPRSULQFLSDOTXH pTXDQWLÀFDUDYDULDomRGRFRQMXQWRGHGDGRVHPWRUQRGDPpGLD 'HÀQLomR Dado um vetor de informações x (x1, x2, ..., xk , o GHVYLRSDGUmRķ(x pGHÀQLGRFRPRVHQGRDUDL]TXDGUDGDGDYDULkQFLD,VWRp
Exemplo 3.10. Na situação apresentada no Exemplo 3.6, temos que
Série Novos Autores da Educação Profissional e Tecnológica
89
90
Capítulo III - Análise exploratória de dados
e
3DUDÀQDOL]DUDSUHVHQWDPRVRFRHÀFLHQWHGHYDULDomR 'HÀQLomR Seja x (x1, x2, ..., xk um vetor de informações, com média x e desvio padrão ķ(x 'HÀQHVHRFRHÀFLHQWHGHYDULDomRCV(x como sendo a razão
(VVD p XPD PHGLGD UHODWLYD TXH DYDOLD R SHUFHQWXDO GH GLVSHUVmR comparada com a média. Esse índice é denominado variabilidade. Uma das grandes vantagens dessa medida é a possibilidade de comparação de vetores GHGLIHUHQWHVGLPHQV}HVRXTXHFDUUHJDPLQIRUPDo}HVGHQDWXUH]DVGLIHUHQWHV XPDYH]TXHHODpDGLPHQVLRQDOHQmRSRVVXLHVFDOD Exemplo 3.11. A equipe de nutricionistas de uma escola está incumbida de acompanhar a nutrição de 6 estudantes e, para isso, realizou um exame diagnóstico de dois diferentes aspectos: massa corporal e altura. As informações coletadas foram registradas nos vetores m (m1, m2, ..., m e a (a1, a2, ..., a , em que os números mi e ai expressam, respectivamente, os dados de massa (em quilos) e altura (em centímetros) do estudante i, i 1, 2, , Se m (, 70, , , 7, 0 e a (170,10,1,1,170,10 , os estudantes apresentaram maior variabilidade na massa ou na altura? 3DUD UHVSRQGHU j TXHVWmR DSUHVHQWDGD QR ([HPSOR SUHFLVDPRV FRPSDUDU YHWRUHV TXH WUD]HP LQIRUPDo}HV GH QDWXUH]DV GLVWLQWDV 3DUD LVVR XVDUHPRVRFRHÀFLHQWHGHYDULDomRTXHpXPDPHGLGDLQGHSHQGHQWHGHHVFDOD Fazendo as contas,3pIiFLOYHUTXHm 7 kJ, a 1 FP, ķ(m 11,kJ e ķ(a ,FP/RJR
3
$TXLFRQVLGHUDPRVDUUHGRQGDPHQWRVSDUDGXDVFDVDVGHFLPDLV
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
e
3RUWDQWRRYHWRUGDVDOWXUDVDSUHVHQWRXXPDYDULDELOLGDGHGHTXH pVLJQLÀFDWLYDPHQWHLQIHULRUjYDULDELOLGDGHGHDSUHVHQWDGDSHORYHWRUGH PDVVDVFRUSRUDLVHLVVRUHVSRQGHDRTXHVWLRQDPHQWRJHUDGRQR([HPSOR Na próxima seção, estudaremos formas menos analíticas, mas não menos importantes, na busca de compreensão do comportamento coletivo de um conjunto ou vetor de informações.
2 Gráficos 1HVWDVHomRYHUHPRVDOJXQVGRVSULQFLSDLVWLSRVGHJUiÀFRVTXHUHVXPHP e comunicam informações. Alguns deles são bem conhecidos, devido a sua YDVWDXWLOL]DomRQRVPHLRVGHFRPXQLFDomR2XWURVPDLVWpFQLFRVVmRPHQRV SRSXODUHVPDVPXLWRLQIRUPDWLYRVGRSRQWRGHYLVWDFLHQWtÀFR &RPHFHPRVSRUGHÀQLURTXHpHVVHREMHWRPDWHPiWLFRWmRYDOLRVR 'HÀQLomR 'DGRV GRLV FRQMXQWRV TXDLVTXHU A e B, chamamos de JUiÀFRRXUHODomR TXDOTXHUVXEFRQMXQWRQmRYD]LRGHA × B. $SULQFtSLRHVVDGHÀQLomRSDUHFHHVWUDQKDSRLVVHPSUHTXHIDODPRVGH JUiÀFRQRVYHPjPHQWHXPDÀJXUD1mRHVWDPRVHTXLYRFDGRVeTXHDOJXQV JUiÀFRVDGPLWHPXPDUHSUHVHQWDomRJHRPpWULFDQXPVLVWHPDGHFRRUGHQDGDV FRPRpRFDVRGHTXDQGRHVWDEHOHFHPRVXPDUHODomRHPGXDVGLPHQV}HVQR SODQR FDUWHVLDQR *UiÀFR SRUWDQWR QDGD PDLV p TXH XP FRQMXQWR GH YHWRUHV TXH SRGHP VHU UHSUHVHQWDGRV FRPR XP FRQMXQWR GH SRQWRV QXP VLVWHPD GH coordenadas. Exemplo 3.12. Considere o produto cartesiano R × R R2 e o conjunto M {(x, y R2y = x`. Claramente, M R2. Uma apresentação gráfica para esse conjunto seria a Figura 3.1.
Série Novos Autores da Educação Profissional e Tecnológica
91
92
Capítulo III - Análise exploratória de dados
),*85$²*5É),&2'$5(/$d®2M
$UHSUHVHQWDomRGHJUiÀFRVQRSODQRFDUWHVLDQRFRPRPRVWUDD)LJXUD é bastante limitada. Na maioria das vezes, necessitamos visualizar relações entre FRQMXQWRV TXH DSUHVHQWDP FDUDFWHUtVWLFDV DGLFLRQDLV DOpP GR VLPSOHV FUX]DPHQWR RUWRJRQDO GH VHXV HOHPHQWRV 7RGDYLD JUDoDV j SUROLIHUDomR GRV UHFXUVRV FRPSXWDFLRQDLVH[LVWHKRMHXPDLQÀQLGDGHGHWLSRVGHJUiÀFRVjQRVVDGLVSRVLomR $XWLOL]DomRGHXPRXRXWURWLSRGHJUiÀFRGHSHQGHGHP~OWLSORVIDWRUHV TXHYmRGHVGHDVFDUDFWHUtVWLFDVGRVIHQ{PHQRVTXHRULJLQDUDPDTXHOHVGDGRV DWpRWLSRGHS~EOLFRTXHVHGHVHMDLQIRUPDUSDVVDQGRSHODH[SHULrQFLDHGRPtQLR GHWpFQLFDVDSURSULDGDVSRUSDUWHGRHODERUDGRUGRJUiÀFR No entanto, a utilização de recursos visuais deve ser feita cuidadosamente. $ÀQDOXPJUiÀFRGHVSURSRUFLRQDOHPVXDVPHGLGDVSRGHFRQGX]LUDFRQFOXV}HV HTXLYRFDGDV
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
$)LJXUDDSUHVHQWDXPJUiÀFRFRQKHFLGRSRUJUiÀFRGHOLQKDV(VVH QRPHVHMXVWLÀFDSRUVHXDVSHFWR2JUiÀFRDSUHVHQWDXPDUHODomRWHPSRYHUVXV número de habitantes (em milhões). Tecnicamente, foram apuradas apenas as PHGLGDVGDSRSXODomRUHIHUHQWHVDRVDQRVGHUHDOL]DomRGRFHQVRGHPRJUiÀFR 1RHQWDQWRRVSRQWRVGRJUiÀFRIRUDPOLJDGRVFRPXPVHJPHQWRGHUHWDSDUD FRPXQLFDUDLGHLDGHFUHVFLPHQWROLQHDUGHVVDSRSXODomRQRVSHUtRGRVHPTXH QmRIRLSRVVtYHOVXDFRQWDJHP*UiÀFRVGHOLQKDFRPRHVVHHPTXHXPDGDV grandezas observadas é o tempo, também são conhecidos na literatura como séries temporais.
),*85$²&5(6&,0(1723238/$&,21$/'2081,&Ì3,2$ )RQWHÀFWtFLD
Série Novos Autores da Educação Profissional e Tecnológica
93
94
Capítulo III - Análise exploratória de dados
$ )LJXUD H[LEH XP WLSR GH JUiÀFR PXLWR SRSXODU FRQKHFLGR SRU JUiÀFRGHVHWRUHV (P JHUDO JUiÀFRV GH VHWRUHV FRPXQLFDP EHP LQIRUPDo}HV TXHVHHQFRQWUDPGLYLGLGDVSRUFDWHJRULDV
),*85$²&(5($,62/($*,126$6(/(*80,126$63$57,&,3$d®21$352'8d®2 6(*81'2$6*5$1'(65(*,¯(6 FRQWH,%*(Primeiras estimativas da safra 2010.
+RMH HP GLD RV SURJUDPDV GH FRPSXWDGRUHV ID]HP JUiÀFRV DXWRPDWLFDPHQWH VHP TXH QRV SUHRFXSHPRV FRP QDGD D QmR VHU ODQoDU RV GDGRVJHUDGRUHV0DVpSRVVtYHOFRQWUXLUJUiÀFRVGHVHWRUHVPDQXDOPHQWHFRP o auxílio de compasso e transferidor. No caso da Figura 3.3, por exemplo, para GHÀQLURkQJXORFRUUHVSRQGHQWHDRVHWRUTXHLUiUHSUHVHQWDUFDGDFDWHJRULDEDVWD ID]HUXPFiOFXORVLPSOHVGHUHJUDGHWUrVMiTXHWRGDDSURGXomR GHYH VHUUHSUHVHQWDGDQXPFtUFXORTXHSRVVXLGHkQJXORLQWHUQRHDVJUDQGH]DV ´kQJXOR GR VHWRU FLUFXODUµ H ´SHUFHQWXDO GH SDUWLFLSDomR QD SURGXomRµ VmR diretamente proporcionais. 2JUiÀFRGD)LJXUDpGLWRVHUXPJUiÀFRGHEDUUDV. Ele mostra como D SRSXODomR EUDVLOHLUD HQFRQWUDYDVH FRQFHQWUDGD HP QRV GLIHUHQWHV (VWDGRV e SRVVtYHO REVHUYDU TXH PDLV GH GD SRSXODomR EUDVLOHLUD HQFRQWUDYDVH FRQFHQWUDGD QR (VWDGR GH 6mR 3DXOR 2EVHUYH WDPEpP TXH Ki EDUUDV GH FRUHV GLIHUHQFLDGDV R TXH SHUPLWH FRPSDUDU D GLVWULEXLomR GD população pelo território em dois momentos distintos.
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
),*85$²',675,%8,d®23(5&(178$/'$3238/$d®26(*81'2$681,'$'(6 '$)('(5$d®2 FRQWH,%*(Censo demográfico 1940/2000.
&RPR GLWR DQWHULRUPHQWH H[LVWHP YiULRV WLSRV GH JUiÀFRV HQWUH RV TXDLVSRGHPRVFLWDUFDUWRJUDPDVSLFWRJUDPDVFOLPRJUDPDVJUiÀFRVSRODUHV WULGLPHQVLRQDLV HWF $ PtGLD H[SORUD IUHTXHQWHPHQWH WRGRV HVVHV WLSRV GH JUiÀFRV ([LVWHP RXWURV PDLV WpFQLFRV TXH FRVWXPDP DFRPSDQKDU WUDEDOKRV FLHQWtÀFRV9HUHPRVDOJXQVGHVWHV~OWLPRVQR&DStWXOR
Série Novos Autores da Educação Profissional e Tecnológica
95
96
Capítulo III - Análise exploratória de dados
Exercícios ,)% &RQVLGHUH R JUiÀFR D VHJXLU TXH VH UHIHUH j SRSXODomR GH XP PXQLFtSLRQRSHUtRGRGHD 2FUHVFLPHQWRGDSRSXODomRQHVVHPXQLFtSLRHQWUHHIRLGH
D PLOK}HV E PLOK}HV F PLOK}HV d) 35 milhões. H PLOK}HV
,)* 2JUiÀFRDVHJXLUPRVWUDRFRQVXPRGHHQHUJLDHOpWULFDHPNZK QXPDUHVLGrQFLDQRSHUtRGRGHMDQHLURDMXQKRGH
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
&RPEDVHQRVGDGRVGRJUiÀFRDVVLQDOHDDOWHUQDWLYDFRUUHWD a) A variação percentual do consumo, no período de janeiro a fevereiro GHIRLGH b) A variação percentual do consumo, no período de maio a junho de IRLGH c) A variação percentual do consumo, no período de fevereiro a março GHIRLGH² d) A variação percentual do consumo, no período de março a abril de IRLGH e) A variação percentual do consumo, no período de abril a maio de IRLGH²
3. A tabela a seguir mostra a distribuição do consumo de energia elétrica HPN:KQRVPHVHVGHMDQHLURDMXQKRGHQXPDUHVLGrQFLD
Meses
Consumo (KWH)
janeiro
240
fevereiro
154
março
101
abril
123
maio
146
Junho
157
&RPEDVHQRVGDGRVGDWDEHODDVVLQDOHDDOWHUQDWLYDLQFRUUHWD
Série Novos Autores da Educação Profissional e Tecnológica
97
98
Capítulo III - Análise exploratória de dados
D 2 FRQVXPR PpGLR PHQVDO QR SULPHLUR WULPHVWUH GH IRL GH NZK E 2FRQVXPRPpGLRPHQVDOQRVHJXQGRWULPHVWUHGHIRLGH NZK F 2FRQVXPRPHGLDQRGHHQHUJLDHOpWULFDIRLGHNZK G 1RSULPHLURWULPHVWUHGHRFRQVXPRGHHQHUJLDHOpWULFDHPNZK foi decrescente. H 1RVHJXQGRWULPHVWUHGHRFRQVXPRGHHQHUJLDHOpWULFDHP NZKIRLFUHVFHQWH $ PpGLD GH LGDGH GH XP JUXSR GH DGROHVFHQWHV p GH DQRV 6H GRLVGHVVHVMRYHQVFRPDVLGDGHVGHHDQRVUHVSHFWLYDPHQWH VmR VXEVWLWXtGRV SRU RXWURV GRLV GH H DQRV GH LGDGH HQWmR SRGHPRVDÀUPDUTXH a) A média de idade do grupo não se altera. E $PpGLDGHLGDGHGRJUXSRSDVVDDVHUGHDQRV F $PpGLDGHLGDGHGRJUXSRSDVVDDVHUGHDQRV G $PpGLDGHLGDGHGRJUXSRSDVVDDVHUGH H ,PSRVVtYHOFDOFXODUXPDYH]TXHQmRIRLLQIRUPDGRRQ~PHURGH adolescentes do grupo. ,)* $WDEHODDVHJXLUPRVWUDDGLVWULEXLomRGRFRQVXPRGHiJXDHP PQRVPHVHVGHMXOKRDGH]HPEURGHQXPDUHVLGrQFLD Meses
Consumo (m3)
Julho
18
agosto
20
setembro
22
outubro
21
novembro
18
dezembro
24
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
Com base na tabela, assinale a alternativa incorreta. D 2DXPHQWRSHUFHQWXDOGRFRQVXPRQRPrVGHDJRVWRFRPSDUDGR FRPRPrVGHMXOKRIRLGH E 2FRQVXPRPHGLDQRPHQVDOHPOLWURVIRLGH c) A taxa percentual de crescimento do maior consumo em relação ao menor consumo foi de 33,33%. G 2FRQVXPRPpGLRPHQVDOHPOLWURVQRVPHVHVGHMXOKRDJRVWRH VHWHPEURIRLGH H 2 FRQVXPR PpGLR PHQVDO HP OLWURV QRV PHVHV GH RXWXEUR QRYHPEURHGH]HPEURIRLGH $ PpGLD DQXDO GH XPD HVFROD SDUD DSURYDomR p 6DEHQGR TXH -RmRWLURXQRSULPHLURELPHVWUHQRVHJXQGRELPHVWUHH QRWHUFHLURELPHVWUHTXDODQRWDPtQLPDDVHUDOFDQoDGDSRUHOHQR TXDUWRH~OWLPRELPHVWUH" D E F G H 6HMDPx (x1,x2,,xn e y (x1+F,x2+F,,xn+F HPTXHc é uma FRQVWDQWHTXDOTXHU0RVWUHTXHy x+F.
6HMDP x (x1, x2, , xn e y (Fx1, Fx2,, Fxn HP TXH c é uma FRQVWDQWHTXDOTXHUGLIHUHQWHGH]HUR0RVWUHTXHy Fx.
Série Novos Autores da Educação Profissional e Tecnológica
99
100
Capítulo III - Análise exploratória de dados
,)% 8PDEDODQoDHQFRQWUDVHGHVUHJXODGDHIRUQHFHDVPHGLGDVFRP XPHUURVLVWHPiWLFRGHJUDPDVDPHQRVGRTXHDPHGLomRUHDO $RVHUXWLOL]DGDSDUDPHGLUQDPRVWUDVGHSDFRWHVGHNJGHDUUR] num supermercado, a diferença entre a média amostral produzida SHODEDODQoDHDPpGLDDPRVWUDOUHDOVHUiGH D JUDPDV b gramas. n F n gramas. G JUDPDV e) gramas. n ,)% 2JUiÀFRDEDL[RPRVWUDRVVDOiULRVHPUHDLVGRVIXQFLRQiULRV de uma loja.
Com base nesses dados, assinale a opção correta. D $ PDLRULD GRV IXQFLRQiULRV UHFHEH VDOiULRV HQWUH 5 H 5 E &LQFRIXQFLRQiULRVUHFHEHPVDOiULRVGH5 F 2PDLRUVDOiULRUHFHELGRQDORMDpGH5 G +iQDORMDXPIXQFLRQiULRTXHUHFHEH5 H $SHQDV GRV IXQFLRQiULRV UHFHEHP VDOiULRV VXSHULRUHV D 5
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
&HVSH8Q% (PHVWDWtVWLFDGXDVPHGLGDVVmRGHJUDQGHLPSRUWkQFLD QD DQiOLVH GH GDGRV PHGLGDV GH WHQGrQFLD FHQWUDO H PHGLGDV GH dispersão. Entre as medidas indicadas abaixo, são, respectivamente, PHGLGDVGHGLVSHUVmRHGHWHQGrQFLDFHQWUDO a) Mediana e média. b) Média e moda. F 9DULkQFLDHPRGD G 'HVYLRSDGUmRHYDULkQFLD H 'HVYLRSDGUmRHGHVYLRPpGLR &HVSH8Q% (P HVWDWtVWLFD TXDQGR WUDEDOKDPRV FRP PHGLGDV GH WHQGrQFLD FHQWUDO D PHGLGD TXH WHP R PHVPR Q~PHUR GH YDORUHV DEDL[RHDFLPDGHODp a) b) c) d)
a média. a mediana. a média aritmética. a média ponderada.
2 FiOFXOR GR OXFUR XQLWiULR L) de certo produto é dado por L 1,2V ²0,C²,6DEHQGRVHTXHRSUHoRXQLWiULRGHYHQGD (V GHVVH SURGXWR p HP PpGLD 5 FRP GHVYLRSDGUmR GH 5 H TXH R FXVWR C XQLWiULR p GH 5 FRP GHVYLR SDGUmRGH5FRQFOXLVHTXHDPpGLDHRGHVYLRSDGUmRGR OXFURXQLWiULRGHVVHSURGXWRVmRUHVSHFWLYDPHQWH D 5H5 E 5H5 F 5H5 G 5H5 $WDEHODDVHJXLUIRUQHFHRQ~PHURPXQGLDOGHDFLGHQWHVIDWDLVGH DHURQDYHVFRPHUFLDLVQRSHUtRGRGHD
Série Novos Autores da Educação Profissional e Tecnológica
101
102
Capítulo III - Análise exploratória de dados
&RPEDVHQHVVDVLQIRUPDo}HVGHWHUPLQHDYDULkQFLDTXHHVVHVGDGRV apresentam.
,)* 'DGRV RV FRQMXQWRV QXPpULFRV A {1000, 1001, 1002, 100, 100,100` e B {0,1,2,,,`SRGHPRVDÀUPDUTXH D 2GHVYLRSDGUmRGHApLJXDODPLOYH]RGHVYLRSDGUmRGHB. E 2GHVYLRSDGUmRGHApLJXDODRGHVYLRSDGUmRGHB. F 2GHVYLRSDGUmRGHApLJXDODRGHVYLRSDGUmRGHB, multiplicado SHORTXDGUDGRGH G 2GHVYLRSDGUmRGHApLJXDODRGHVYLRSDGUmRGHB, dividido por H 2GHVYLRSDGUmRGHApLJXDODRTXDGUDGRGRGHVYLRSDGUmRGHB. ,)* 2V VDOiULRV GRV HPSUHJDGRV GD HPSUHVD X VmR PDLRUHV GRV TXH RV GD HPSUHVD Y para todos os empregados comparados LQGLYLGXDOPHQWH &RP EDVH QHVVDV LQIRUPDo}HV p FRUUHWR DÀUPDU TXH D 2GHVYLRSDGUmRGRVVDOiULRVGRVHPSUHJDGRVGDHPSUHVDXp PHQRUGRTXHRGRVVDOiULRVGRVHPSUHJDGRVGDHPSUHVDY. E 2 GHVYLRSDGUmR GRV VDOiULRV GRV HPSUHJDGRV p R PHVPR SDUD ambas as empresas. F 2GHVYLRSDGUmRGRVVDOiULRVGRVHPSUHJDGRVGDHPSUHVDXp PDLRUGRTXHRGRVVDOiULRVGRVHPSUHJDGRVGDHPSUHVDY. G 2 GHVYLRSDGUmR GRV VDOiULRV GRV HPSUHJDGRV GD HPSUHVD X é LJXDODRGHVYLRSDGUmRGRVVDOiULRVGRVHPSUHJDGRVGDHPSUHVD YPXOWLSOLFDGRSRU . H 1mR Ki HOHPHQWRV SDUD VH FRPSDUDUHP RV GHVYLRVSDGUmR GRV VDOiULRVGHVVDVHPSUHVDV
Série Novos Autores da Educação Profissional e Tecnológica
CAPÍTULO IV ESTATÍSTICA DESCRITIVA
Probabilidade e Estatística: um curso introdutório
Estatística descritiva
Atualmente, grande parte da informação difundida, pelos meios de FRPXQLFDomRHPHVPRDVSURGX]LGDVQRPHLRDFDGrPLFRSURYpPGDDQiOLVH GH GDGRV TXH IRUDP FROHWDGRV H GH DOJXPD PDQHLUD UHODFLRQDGRV D RXWUDV informações conhecidas. 2 ,QVWLWXWR %UDVLOHLUR GH *HRJUDÀD H (VWDWtVWLFD ,%*( p XP yUJmR GR JRYHUQR EUDVLOHLUR TXH UHDOL]D SHVTXLVDV LQWHQVLYDV H SHULyGLFDV VREUH R crescimento, comportamento, distribuição espacial e organização social da população brasileira, entre outras características desse conjunto de pessoas. $V LQIRUPDo}HV VmR FROHWDGDV H VLVWHPDWL]DGDV VHJXQGR FULWpULRV FLHQWtÀFRV UREXVWRV H DV FRQFOXV}HV DGYLQGDV GD DQiOLVH GHVVDV LQIRUPDo}HV TXDQGR comparadas com outras obtidas em um outro período de tempo, constituem YDOLRVRVLQVWUXPHQWRVSDUDRGHVHQYROYLPHQWRGDVFLrQFLDVKXPDQDVHVRFLDLVH LQFOXVLYHSDUDHIHLWRGHGHÀQLomRGHSROtWLFDVS~EOLFDV
Série Novos Autores da Educação Profissional e Tecnológica
105
106
Capítulo IV - Estatística descritiva
2 H[HPSOR GD )LJXUD D VHJXLU DSUHVHQWD XPD FRPSDUDomR GH informações colhidas em diferentes épocas.
),*85$² ',675,%8,d®23(5&(178$/'$3238/$d®26(*81'2$6*5$1'(6 5(*,¯(6 )RQWH,%*(Censo demográfico 1940-2000.
'DDQiOLVHGHVVDVLQIRUPDo}HVSRGHPRVREVHUYDUTXHDV5HJL}HV6XGHVWH e Nordeste apresentam as maiores participações da população relativa do País, DLQGD TXH SDVVDGRV DQRV HQWUH RV SHUtRGRV REVHUYDGRV 3RGHVH WRGDYLD LQIHULU TXH QR SHUtRGR GH D DV PDLRUHV WD[DV GH FUHVFLPHQWR RFRUUHUDPQDV5HJL}HV&HQWUR2HVWHH1RUWH 1HVWHFDStWXORYHUHPRVTXHpD(VWDWtVWLFDDFLrQFLDTXHVHRFXSDGHVVH WLSR GH WUDEDOKR $SUHQGHUHPRV TXDLV VmR DV HWDSDV GR WUDEDOKR HVWDWtVWLFR H RV FXLGDGRV TXH GHYHPRV WHU QD FROHWD H QR WUDWDPHQWR GH LQIRUPDo}HV SDUD YLDELOL]DUDWRPDGDGHGHFLVmR9HUHPRVWDPEpPDLPSRUWkQFLDGHVWHWUDEDOKR na comunicação de informações.
1 Conceitos básicos De origem muito antiga, a Estatística teve suas primeiras atividades relacionadas com o recenseamento das populações agrícolas chinesas, com UHJLVWURV TXH GDWDP GH D& 'XUDQWH PXLWR WHPSR WHYH XP FDUiWHU
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
meramente descritivo, mas, atualmente, impulsionada pelos avanços da tecnologia, ganhou statusGHFLrQFLDHVXDVWpFQLFDVVmRFDGDYH]PDLVGLIXQGLGDV HVHUYHPGHVXSRUWHSDUDRGHVHQYROYLPHQWRGHRXWUDVFLrQFLDV 0XLWDV YH]HV WUDWDGD FRPR XP UDPR GD PDWHPiWLFD D (VWDWtVWLFD moderna possui métodos e técnicas próprias, daí o seu status GHFLrQFLDHPERUD DVIHUUDPHQWDVPDWHPiWLFDVOKHVHMDPHVVHQFLDLV Para nossos propósitos, entenderemos Estatística como um conjunto de PpWRGRVHWpFQLFDVTXHDX[LOLDPDWRPDGDGHGHFLVmRPHGLDQWHDSUHVHQoDGH incerteza. $ LQFHUWH]D HVWi GH DOJXPD PDQHLUD SUHVHQWH HP WRGR R WUDEDOKR HVWDWtVWLFR,VVRSRUTXHDPDLRULDGRVIHQ{PHQRVTXHDQDOLVDPRVHVWiSHUPHDGD por ela, sejam fenômenos naturais, sociais, econômicos ou do comportamento KXPDQR2WUDWDPHQWRTXDQWLWDWLYRDGHTXDGRjLQFHUWH]DpREWLGRSRUPHLR GRHVWXGRGHSUREDELOLGDGHVTXHLQWURGX]LPRVQR&DStWXOR 0HVPRPHGLDQWHLQFHUWH]DVRIDWRpTXHRWHPSRWRGRGHFLV}HVGHYHP ser tomadas e o estudo das técnicas da Estatística e de probabilidades auxiliam a minimizar seus riscos. $(VWDWtVWLFDSRGHVHUGLYLGLGDHPGXDVSDUWHVGLVWLQWDVDEstatística Descritiva e a Estatística Inferencial2REMHWLYRGD(VWDWtVWLFD'HVFULWLYDpUHVXPLUDVSULQFLSDLV FDUDFWHUtVWLFDVGHXPYHWRUGHLQIRUPDo}HVSRUPHLRGHWDEHODVJUiÀFRVHUHVXPRV QXPpULFRV-iDWRPDGDGHGHFLVmRVHDSRLDQRXVRGD(VWDWtVWLFD,QIHUHQFLDOTXHYDL DOpPGDPHUDGHVFULomRGDVLQIRUPDo}HVHpUHVXOWDGRGHXPDDQiOLVHPDLVSURIXQGD $ (VWDWtVWLFD ,QIHUHQFLDO YLVD j EXVFD SRU FRQFOXV}HV VDWLVIDWyULDV PHVPR GLDQWHGHLQIRUPDo}HVLQFRPSOHWDV2DOLFHUFHGDVWpFQLFDVGD(VWDWtVWLFD,QIHUHQFLDO HVWi QR HVWXGR GH probabilidades. Duas das importantes técnicas utilizadas nesse campo da Estatística são a estimação de parâmetros e os WHVWHVGHKLSyWHVHV.
$HVWLPDomRGHSDUkPHWURVFRQVLVWHHPXWLOL]DUXPFRQMXQWRGHGDGRVLQFRPSOHWRVDRTXDOLUHPRV FKDPDUGHDPRVWUDHQHOHFDOFXODUHVWLPDWLYDVGHTXDQWLGDGHVGHLQWHUHVVH(VVDVHVWLPDWLYDVSRGHP ser pontuais (representadas por um único valor) ou intervalares. 2 IXQGDPHQWR GRV WHVWHV GH KLSyWHVHV p OHYDQWDU VXSRVLo{HV DFHUFD GH XPD TXDQWLGDGH QmR conhecida e utilizar, também, dados incompletos para criar um critério de escolha.
Série Novos Autores da Educação Profissional e Tecnológica
107
108
Capítulo IV - Estatística descritiva
3DUDVHWHUXPDLGHLDFRQVLGHUHDVLWXDomRVHJXLQWH Exemplo 4.1. Um laboratório deseja verificar se uma nova droga aumenta a produção de testosterona em homens com idade acima de 35 anos. Ao aplicá-la a um grupo de 40 indivíduos, constatou-se que, depois de um período de tempo, a droga aumentou significativamente a quantidade do referido hormônio. Nessas condições, a nova droga deve ou não ser lançada no mercado? $TXHVWmRSRVWDQR([HPSORTXHHQYROYHDWRPDGDGHXPDGHFLVmR pode ser resolvida através da Estatística Inferencial. Uma outra situação similar é DSUHVHQWDGDQR([HPSOR Exemplo 4.2. Em uma fábrica de parafusos, a peça é considerada dentro da especificação, caso seu comprimento esteja no intervalo entre 4,8 cm e 5,2 cm. Os técnicos de controle de qualidade selecionam diariamente 100 parafusos fabricados e calculam o comprimento médio. Conhecendo a variabilidade nos tamanhos dos parafusos fabricados, caso o comprimento médio esteja abaixo de 4,99 cm ou acima de 5,01 cm, o processo será interrompido. 1HVWHH[HPSORHVSHUDVHTXHRFRPSULPHQWRPpGLRGHXPVXEFRQMXQWR dos parafusos esteja dentro de um intervalo. Caso isso não ocorra, o processo de produção sofre interrupção. Neste caso, a Estatística inferencial é utilizada para criar XPDUHJUDGHGHFLVmRFRPEDVHHPREVHUYDo}HVGHXPVXEFRQMXQWRGHSHoDV $SHVDU GR LQWHUHVVH SUiWLFR GD LQIHUrQFLD QmR DERUGDUHPRV HVVDV WpFQLFDVDTXLGHYLGRDRFDUiWHULQWURGXWyULRGHVWHWUDEDOKR&RPYLVWDVDLPHUJLU QHVWH XQLYHUVR DSUHVHQWDPRV DOJXPDV GHÀQLo}HV EiVLFDV TXH GHYHUmR VHU QDWXUDOPHQWHDVVRFLDGDVjWHRULDTXHYHPVHQGRGHVHQYROYLGDDWpDTXL 'HÀQLomR'L]HPRVTXHpopulação é o conjunto de todas as unidades3 VREUHDVTXDLVKiRLQWHUHVVHGHLQYHVWLJDUXPDRXPDLVFDUDFWHUtVWLFDV 2 FRQFHLWR GH SRSXODomR HP (VWDWtVWLFD p EHP PDLV DPSOR TXH R XVR comum dessa palavra. A população pode ser formada por pessoas, domicílios, SHoDV GH SURGXomR FREDLDV RX TXDOTXHU RXWUR HOHPHQWR D VHU LQYHVWLJDGR $
3
Cada elemento da população é também denominado de unidade estatística.
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
caracterização da população é feita em função do problema a ser estudado. 3DUD TXH KDMD XPD FODUD GHÀQLomR GDV XQLGDGHV TXH IRUPDP D SRSXODomR p QHFHVViULD D HVSHFLÀFDomR GH WUrV HOHPHQWRV XPD FDUDFWHUtVWLFD HP FRPXP ORFDOL]DomRWHPSRUDOHORFDOL]DomRJHRJUiÀFD Exemplo 4.3. Estudo da obesidade em estudantes do Instituto Federal de Brasília (IFB) em 2010 por intermédio da medida do índice de massa corpórea. 1DVLWXDomRDSUHVHQWDGDQR([HPSORFDGDXQLGDGHHVWDWtVWLFDTXHLQWHJUD a população possui as características de possuir massa (característica comum), VHUHVWXGDQWHHPORFDOL]DomRWHPSRUDO HVHUHVWXGDQWHGR,)%ORFDOL]DomR JHRJUiÀFD /RJRDSRSXODomRpRFRQMXQWRGRVHVWXGDQWHVGR,)%HP 6HQGRXPFRQMXQWRXPDSRSXODomRSRGHVHUÀQLWDRXLQÀQLWD0HVPR TXDQGRÀQLWDPXLWDVYH]HVWRUQDVHLQYLiYHOGHYLGRDUD]}HVGHWHPSRRXSRU economia de recursos, a observação da característica desejada sobre todas as suas unidades. Neste caso, coletamos uma amostra dessa população. 'HÀQLomR'L]HPRVTXHXPDDPRVWUDpXPVXEFRQMXQWRQmRYD]LRGD população. (PSDUWLFXODUTXDQGRDDPRVWUDpDSUySULDSRSXODomRFKDPDPRVRSURFHVVR de coleta de informações de censo4XDQGRRFHQVRWRUQDVHLQYLiYHOODQoDPRVPmR GHXPDDPRVWUDTXHHPRXWUDVSDODYUDVpXPDMDQHOD para o universo populacional. 'HSHQGHQGRGDHVFROKDGHVVDMDQHODSRGHPRVWHUXPkQJXORIDYRUiYHORXQmRSDUDD SHUFHSomRGRFRPSRUWDPHQWRGHWRGDDSRSXODomRTXDQWRjFDUDFWHUtVWLFDGHVHMDGD ([LVWHPWpFQLFDVTXHQRVDX[LOLDPQRWUDEDOKRGHHVFROKHUXPDDPRVWUD TXH VHMD VXÀFLHQWHPHQWH UHSUHVHQWDWLYD GD SRSXODomR (VVDV WpFQLFDV VmR chamadas de WpFQLFDVGHDPRVWUDJHP.
2 Amostragem 4XDQGRGL]HPRVTXHXPDSHVVRDp´KRQHVWDHWUDEDOKDGRUDµHVWDPRV HPLWLQGRXPMXt]RGHYDORUTXHWHPRVHPUD]mRGHDOJXPDVDo}HVSUDWLFDGDV SRU DTXHOD SHVVRD PXLWDV YH]HV VHP FRQKHFHU SURIXQGDPHQWH VHXV DWRV H
Série Novos Autores da Educação Profissional e Tecnológica
109
110
Capítulo IV - Estatística descritiva
DWLYLGDGHV4XDQGRSURFXUDPRVXPUHVWDXUDQWHSDUDMDQWDUQRUWHDPRVDQRVVD HVFROKD SRU DOJXPDV LQIRUPDo}HV FROHWDGDV HQWUH DPLJRV RX HP H[SHULrQFLDV anteriores, ou mesmo nos baseamos em informações oferecidas pela internet, TXHVmRIRUQHFLGDVEDVHDGDVHPFULWpULRVGHVFRQKHFLGRV 2IDWRpTXHQHPVHPSUHWLUDPRVFRQFOXV}HVFRUUHWDVVREUHDVSHVVRDV ou nem sempre escolhemos um bom restaurante para jantar. Ainda assim, o tempo todo escolhemos amostras para subsidiar nossas decisões e ansiamos por decisões sensatas. 'HÀQLomRA DPRVWUDJHPpRUDPRGD(VWDWtVWLFDTXHHVWXGDDVUHODo}HV HQWUHXPDDPRVWUDHDSRSXODomRGDTXDOHODIRLH[WUDtGD 3DUDTXHXPOHYDQWDPHQWRSRUDPRVWUDJHPVHMDEHPVXFHGLGRpQHFHVViULR TXHVHFRQKHoDSURIXQGDPHQWHDSRSXODomR3RUH[HPSORSDUDVHYHULÀFDUDTXDOLGDGH GDiJXDGHXPUHVHUYDWyULREDVWDDFROHWDGHXPDSHTXHQDSDUFHODGHVHXYROXPH 2VH[DPHVODERUDWRULDLVQHVWHFDVRVmRFRQFOXVLYRVGHYLGRDRIDWRGHDSRSXODomR HVWXGDGDVHUKRPRJrQHD1RFDVRJHUDOQHPVHPSUHHVVDKRPRJHQHLGDGHRFRUUHH HVVHpXPGHWDOKHLPSRUWDQWHTXHGHYHVHUOHYDGRHPFRQVLGHUDomRSHORSHVTXLVDGRU SDUDDH[HFXomRFRPr[LWRGHXPWUDEDOKRGHDPRVWUDJHP 4XDQGR EHP UHDOL]DGR XP HVWXGR SRU DPRVWUDJHP DSUHVHQWD GLYHUVDV YDQWDJHQVHPUHODomRDRFHQVRWDLVFRPRFXVWRUHGX]LGRGHYLGRjQHFHVVLGDGH de um menor volume de dados; maior rapidez, decorrente da velocidade de WDEXODomRGDVLQIRUPDo}HVPDLRUDEUDQJrQFLDXPDYH]TXHSRGHVHUUHDOL]DGR HP VLWXDo}HV HP TXH D UHDOL]DomR GR FHQVR p LPSRVVtYHO PDLRU H[DWLGmR QD PHGLGD HP TXH SRVVLELOLWD WUDEDOKDU FRP XPD HTXLSH PDLV EHP SUHSDUDGD DXPHQWDQGRDTXDOLGDGHGDVLQIRUPDo}HVFROHWDGDV
2.1 Técnicas de amostragem 2 SURFHVVR GH DPRVWUDJHP SRGH VHU DOHDWyULR4 ou não aleatório. Na Seção 3, introduzimos uma discussão sobre aleatoriedade. Para o momento,
Um processo aleatório de amostragem é também denominado de probabilístico, pois permite a DSOLFDomRGHPpWRGRVGHLQIHUrFLDHGDWHRULDGHSUREDELOLGDGHV
4
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
HQWHQGDPRVSRUDOHDWyULRDTXLORTXHQmRpGHWHUPLQtVWLFRLVWRpDTXLORTXHp impossível de se prever ou determinar. $ÀUPDPRV TXH D DOHDWRULHGDGH QD HVFROKD GD DPRVWUD p IXQGDPHQWDO para garantir a representatividade da população. Entretanto, em muitas VLWXDo}HVSUiWLFDVH[LVWHPUHVWULo}HVTXHLPSHGHPTXHDVHOHomRGDDPRVWUDVHMD WRWDOPHQWHDRDFDVR/LVWDPRVDEDL[RDOJXQVWLSRVGHDPRVWUDJHPQmRDOHDWyULD MXQWDPHQWHFRPDOJXPDVVLWXDo}HVHPTXHVXDDSOLFDomRpSRVVtYHO $PRVWUDJHP SRU DFHVVLELOLGDGH a amostra atinge apenas a parte acessível da população. Exemplo 4.4. Num vagão carregado de minério, por dificuldades de atingir todos os pontos, uma amostra é coletada apenas na camada superficial de 20 cm de minério. $PRVWUDJHPDHVPRDDPRVWUDpFRQVWLWXtGDSHORVHOHPHQWRVTXHVH consegue capturar de uma população. Exemplo 4.5. Num galpão de aves, uma amostra pode ser constituída por aves que foram tomadas no instante da coleta, sem, entretanto, ter havido sorteio. $PRVWUDJHPLQWHQFLRQDORSHVTXLVDGRUHVFROKHDVHXMXt]RRVHOHPHQWRV GDSRSXODomRTXHMXOJDVLJQLÀFDWLYRVSDUDFRQVWLWXtUHPVXDDPRVWUD Exemplo 4.6. Um historiador, por exemplo, pode optar por ouvir moradores de uma pequena cidade com mais de 90 anos a fim de reconstruir um aspecto histórico importante. $PRVWUDJHP SRU YROXQWDULDGR FDVR HP TXH R SURFHVVR GH REWHQomR GRVGDGRVpGHVDJUDGiYHOHDDPRVWUDpFRQVWUXtGDDSDUWLUGDLQLFLDWLYD das unidades estatísticas. Exemplo 4.7. Uma pesquisa sobre alcoolismo pode ser realizada a partir de uma amostra formada por alcoólatras voluntários. 'HDFRUGRFRPDHVSHFLÀFLGDGHGRTXHVHSUHWHQGHSHVTXLVDUpSRVVtYHO fazer uma amostragem aleatória. Sendo assim, teremos toda a teoria probabilística
Série Novos Autores da Educação Profissional e Tecnológica
111
112
Capítulo IV - Estatística descritiva
j QRVVD GLVSRVLomR H D LQIHUrQFLD WRUQDVH YLiYHO (QWUH DV SRVVLELOLGDGHV GH DPRVWUDJHPDOHDWyULDGHVWDFDPRV $PRVWUDJHP DOHDWyULD VLPSOHV consiste em selecionar aleatoriamente uma amostra de medida n em uma população de medida N3UHVVXS}H VHTXHDSRSXODomRpKRPRJrQHDLVWRpWRGDVDVXQLGDGHVHVWDWtVWLFDV WrPDPHVPDFKDQFHGHRFRUUHU6HDSRSXODomRIRUGLVFUHWDDHVFROKD dos elementos da amostra pode se dar com ou sem reposição. Exemplo 4.8. Numa população de cardinalidade N 0, a escolha de uma amostra aleatória simples com cardinalidade N 10 pode ser feita representandose cada unidade num papel numerado de 1 a 50 e efetuando-se um sorteio, com ou sem reposição, dessas 10 unidades. $PRVWUDJHP VLVWHPiWLFD5 caso exista uma lista das unidades SRSXODFLRQDLV D DPRVWUDJHP VLVWHPiWLFD p XPD WpFQLFD VLPSOHV TXH consiste na escolha de uma unidade para compor a amostra a cada bloco regular de tamanho 3URFHGHVHDVVLPSULPHLUDPHQWHFRQVLGHUDVH ; DVHJXLUVRUWHLDVHXPQ~PHURLQWHLURQRLQWHUYDOR TXH serve como ponto de partida para a escolha do primeiro elemento a ser incluído na amostra; descartando os k²1SUy[LPRVHOHPHQWRVVHOHFLRQD se o segundo, e assim por diante. Tal como na amostragem aleatória VLPSOHV p QHFHVViULD D H[LVWrQFLD GH XP FDGDVWUR 8PD GDV JUDQGHV YDQWDJHQV GD DPRVWUDJHP VLVWHPiWLFD HP UHODomR j DPRVWUDJHP aleatória simples, é a praticidade na seleção dos elementos. Problemas FRPDDPRVWUDJHPVLVWHPiWLFDSRGHPVXUJLUTXDQGRDVHTXrQFLDGRV elementos no cadastro induz a um comportamento periódico ou cíclico na característica a ser investigada. Exemplo 4.9. Considere uma vila com 20 casas numeradas de 1 a 20. Se todas as casas cujos números são múltiplos de 4 estiverem mais perto da linha de trem e o intuito é medir poluição sonora, a amostragem sistemática não será adequada.
5 &RPR QHP WRGDV DV XQLGDGHV VmR SDVVtYHLV GH VHOHomR HVVH SURFHGLPHQWR p FODVVLÀFDGR FRPR TXDVHDOHDWyULR ⎣x⎦ é uma notação para representar o maior número inteiro menor ou igual a x. Por exemplo, se y 17,2, então ⎣y⎦ 17 e se z 17, então ⎣z⎦ 17.
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
$PRVWUDJHPDOHDWyULDHVWUDWLÀFDGDTXDQGRDSRSXODomRpKHWHURJrQHDHIRU SRVVtYHODIRUPDomRGHKHVWUDWRVKRPRJrQHRVHPUHODomRjFDUDFWHUtVWLFD estudada, esse procedimento consiste na aplicação de amostragem DOHDWyULDVLPSOHVRXDPRVWUDJHPVLVWHPiWLFDGHQWURGHFDGDHVWUDWR$ DPRVWUDJHPHVWUDWLÀFDGDpYDQWDMRVDTXDQGRKiRFRQKHFLPHQWRSUpYLR GH JUXSRV TXH VHMDP PDLV KRPRJrQHRV LQWHUQDPHQWH H KHWHURJrQHRV HQWUHVLHPUHODomRjFDUDFWHUtVWLFDLQYHVWLJDGD1HVVDVVLWXDo}HVKiXP JDQKRHPUHODomRjDPRVWUDJHPDOHDWyULDVLPSOHVSRLVDVHOHomRGHQWUR GRV HVWUDWRV OHYD j GLPLQXLomR GR WDPDQKR GH DPRVWUD PDQWHQGR D precisão das estimativas. Uma etapa importante da amostragem aleatória HVWUDWLÀFDGD p D DORFDomR GD DPRVWUD SHORV HVWUDWRV RX VHMD TXDQWRV HOHPHQWRVGDDPRVWUDSHUWHQFHUmRDRHVWUDWRDRHVWUDWRDRHVWUDWR K'RLVWLSRVGHDORFDomRVmRFRPXPHQWHDSOLFDGRVDORFDomRXQLIRUPH (mesmo número de elementos nos estratos) e alocação proporcional (número de elementos proporcional ao tamanho do estrato). Exemplo 4.10. No Instituto Federal de Brasília (IFB), campus Planaltina, há estudantes de educação técnica matriculados em duas modalidades: integrada e subsequente. Um projeto de extensão consiste em abrir turmas de Inglês para atendimento conjunto desses estudantes. Para tanto, a proficiência dos estudantes nessa língua será avaliada numa amostra de 10% da população, para definir o ponto de partida do curso. Se no IFB, atualmente, 60% das matrículas são de estudantes na modalidade subsequente, então, para um melhor diagnóstico, pode ser viável uma amostra aleatória estratificada por modalidade de curso. $PRVWUDJHPSRUclusters: neste método, em vez da seleção de unidades da população, são selecionados conglomerados (clusters) dessas unidades HMiGHQWURGRFRQJORPHUDGRSURFHGHVHjVHOHomRGHDOJXPDVXQLGDGHV TXH FRPSRUmR D DPRVWUD 7UDWDVH GH XPD DOWHUQDWLYD LQWHUHVVDQWH TXDQGRDVXQLGDGHVHVWmRPXLWRDIDVWDGDVJHRJUDÀFDPHQWHRXTXDQGR não dispomos de uma lista das unidades. Esse tipo de amostragem induz LQGLUHWDPHQWHjDOHDWRULHGDGHQDVHOHomRGDVXQLGDGHVTXHIRUPDUmRD amostra e tem a grande vantagem de facilitar a coleta de dados. Exemplo 4.11. Se a unidade de interesse, por exemplo, for um estudante, pode ser que não exista um cadastro de estudantes, mas sim de escolas. Portanto, pode-se selecionar escolas e nelas investigar todos os alunos, ou alguns deles.
Série Novos Autores da Educação Profissional e Tecnológica
113
114
Capítulo IV - Estatística descritiva
3 Aleatoriedade ,QLFLDPRVHVWDVHomRFRPXPDGLVFXVVmRVREUHDOHDWRULHGDGH1D6HomR DSUHVHQWDPRVRFRQFHLWRGHDOHDWyULRFRPRDTXLORTXHQmRpGHWHUPLQtVWLFRLVWR pDTXLORTXHpLPSRVVtYHOGHVHSUHYHURXGHWHUPLQDU 1RWRFDQWHjDOHDWRULHGDGHQDQDWXUH]DVXDH[LVWrQFLDRXQmRRVÀOyVRIRV JUHJRVFOiVVLFRVDFRPSUHHQGLDPVREGXDVFRQFHSo}HVGLIHUHQWHVDDOHDWRULHGDGH VXEMHWLYDGH'HPRNULWRV,TXHDFRQFHELDDSHQDVFRPRRXWURQRPHSDUDDLJQRUkQFLD humana acerca das causas determinantes de uma dada estrutura ou de um dado IHQ{PHQRHFRQVHTXHQWHPHQWHHODVHULDDSHQDVDH[SUHVVmRGDQRVVDLQFDSDFLGDGH de descrever, prever ou controlar, sendo, portanto, um determinismo disfarçado; e DDOHDWRULHGDGHREMHWLYDGH(SLNXURV,TXHDFRQFHELDFRPRDDXVrQFLDGHFDXVDV ou seja, um processo aleatório objetivo teria comportamento impossível de se prever H FRQWURODU H VH R UHSHWLUPRV D SDUWLU GH HVWDGRV LQLFLDLV H FDXVDV LGrQWLFDV HOH SURGX]LUiHIHLWRVGLIHUHQWHVTXHVmRGHWHUPLQDGRVWRWDOPHQWHDRDFDVR (QWUH RV PDLV LPSRUWDQWHV VHJXLGRUHV GH 'HPRNULWRV SRGHPRV FLWDU R PDWHPiWLFR/DSODFHHRItVLFR(LQVWHLQ(VWH~OWLPRpRDXWRUGDFpOHEUHIUDVH´'HXV QmRMRJDGDGRVµPDVWDPEpPpXPGRVSURSRVLWRUHVGHXPH[SHULPHQWRHP TXHWHULDRLQWXLWRGHFRPSURYDUDQmRH[LVWrQFLDGDDOHDWRULHGDGHREMHWLYDGH (SLNXUXV(QWUHWDQWRQRVDQRVDUHDOL]DomRGHVVHPHVPRH[SHULPHQWRYHLR SURYDUH[DWDPHQWHRFRQWUiULRGRTXHRPRWLYRXSURYRXTXHRLQGHWHUPLQLVPR H D DOHDWRULHGDGH REMHWLYD VmR TXDOLGDGHV LQWUtQVHFDV GRV IHQ{PHQRV QDWXUDLV microscópicos, isto é, a aleatoriedade objetiva, de fato, existe na natureza.
3.1 Noção intuitiva de variável aleatória (PXPOHYDQWDPHQWRGHGDGRVFHQVLWiULRRXSRUDPRVWUDJHPLQYHVWLJD VHXPDRXPDLVFDUDFWHUtVWLFDVGHLQWHUHVVHTXHVXSRVWDPHQWHYDULDPGHXPD
)LOyVRIRJUHJRSUpVRFUiWLFRTXHYLYHXHQWUHRVDQRVHD&'LVFtSXORGH/HXFLSSXVSRUVXD WHRULDDW{PLFDSDUDR&RVPRVPXLWRVRFRQVLGHUDPR´SDLGDFLrQFLDPRGHUQDµ )LOyVRIRJUHJRTXHYLYHXHQWUHD&HD&IXQGDGRUGDHVFRODÀORVyÀFDFKDPDGD(SLFXULVPR )D]LDSDUWHGRVVHXVHQVLQDPHQWRVTXHRXQLYHUVRpLQÀQLWRHHWHUQRHTXHHYHQWRVQRPXQGRVmRHP ~OWLPDDQiOLVHEDVHDGRVQRVPRYLPHQWRVHLQWHUDo}HVGHiWRPRVTXHVHGHVORFDPQRHVSDoRYD]LR
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
unidade para outra. Essas características serão chamadas a partir de agora de YDULiYHLVDOHDWyULDV. Exemplo 4.12. Um pesquisa eleitoral investiga a intenção de votos da população em três candidatos, A, B ou C. Ao se entrevistar um indivíduo numa amostra aleatória da população, é imprevisível saber, de antemão, a intenção de voto desse eleitor. Por esse caráter imprevisível, denominamos a característica “intenção de voto” como variável aleatória. $VYDULiYHLVDOHDWyULDVVmRFODVVLÀFDGDVGHDFRUGRFRPRFRQMXQWRHPTXH DVVXPHP´YDORUµ8PDYDULiYHODOHDWyULDSRGHVHUXPDTXDQWLGDGHVREUHDTXDO podem ser realizadas operações aritméticas, ou pode ser um atributo, como uma característica genética, uma zona de moradia ou uma classe social. No primeiro FDVRDYDULiYHOpFODVVLÀFDGDFRPRquantitativa e na outra situação como qualitativa. $ FODVVLÀFDomR GD YDULiYHO YDL VHU GHWHUPLQDQWH SDUD R WLSR GH DQiOLVH HVWDWtVWLFDDVHUFRQGX]LGD6REUHXPDYDULiYHOTXDOLWDWLYDQmRSRGHPRVFDOFXODU PXLWRV GRV UHVXPRV QXPpULFRV WDLV FRPR D PpGLD DULWPpWLFD D YDULkQFLD H R GHVYLRSDGUmR 3RU RXWUR ODGR R JUiÀFR GH VHWRUHV p PDLV DGHTXDGR SDUD UHSUHVHQWDUYDULiYHLVTXDOLWDWLYDVGRTXHTXDQWLWDWLYDV $VYDULiYHLVDOHDWyULDVTXDOLWDWLYDVSRGHPVHUFODVVLÀFDGDVFRPRordinais ou nominais$YDULiYHODOHDWyULDGR([HPSORpTXDOLWDWLYDQRPLQDOSRLVDVVXPH YDORUHVQXPFRQMXQWRTXHQmRDGPLWHRUGHQDomR6HQDTXHODPHVPDDPRVWUDGR ([HPSORWLYpVVHPRVLQWHUHVVHHPLQYHVWLJDU´RJUDXGHHVFRODULGDGHGRVHOHLWRUHVµ e estes tivessem como possibilidades de resposta as opções nenhum, fundamental, PpGLRRXVXSHULRUHQWmRDYDULiYHOVHULDFODVVLÀFDGDFRPRTXDOLWDWLYDRUGLQDO 3RU VXD YH] DV YDULiYHLV TXDQWLWDWLYDV SRGHP VHU discretas TXDQGR assumem valores num conjunto discreto; contínuas TXDQGR DVVXPHP YDORUHV num conjunto contínuo; ou mesmo nem discretas nem contínuas TXDQGR DVVXPHPYDORUHVHPXPFRQMXQWRTXHQmRpGLVFUHWRQHPFRQWtQXR &RPR H[HPSOR GH YDULiYHO DOHDWyULD TXDQWLWDWLYD GLVFUHWD WHPRV ´RQ~PHURGHDFLGHQWHVQD%5QXPDGDGDVHPDQDµ-iDYDULiYHO´HVWDWXUD GHXPHVWXGDQWHGR,)%µpXPDYDULiYHODOHDWyULDTXDQWLWDWLYDFRQWtQXDXPDYH] TXHKiXPLQWHUYDORGLJDPRVGHDPHWURVHPTXHHODSRGHWRPDUYDORUHV
Série Novos Autores da Educação Profissional e Tecnológica
115
116
Capítulo IV - Estatística descritiva
4 Técnicas da Estatística Descritiva A principal função da Estatística Descritiva é resumir as informações FRQWLGDVHPXPYHWRUTXHDVFDUUHJDPSRUPHLRGHWDEHODVJUiÀFRVHPHGLGDV (resumos numéricos). $ GHVFULomR GRV GDGRV GHYH VHU REMHWLYD WHU SUHFLVmR GH VLJQLÀFDGR H VLPSOLFLGDGH QR FiOFXOR SDUD TXH DV SHVVRDV SRVVDP FRPSUHHQGHU H eventualmente, reproduzir os resultados.
4.1 Análise da frequência Considere x (x1, x2, ..., xn um vetor de informações. Sem perda de JHQHUDOLGDGHSRGHPRVVXSRUTXHVHWUDWDGHXPUROFRQIRUPHQRPHQFODWXUD XWLOL]DGD QR &DStWXOR FDVR WUDWHVH GH XPD YDULiYHO DOHDWyULD TXDQWLWDWLYD &RPEDVHQRUROÀFDIiFLOYLVXDOL]DUDIUHTXrQFLDGHFDGDLQIRUPDomR3RGHPRV DVVLPFRQVWUXLUDWDEHODGHIUHTXrQFLDV Exemplo 4.13. A tabela a seguir resume as informações da variável estado civil presente em um questionário aplicado a moradores de comunidades de baixa renda em São Paulo. 7$%(/$²(67$'2&,9,/(080$$02675$'(,1',9Ì'826
)RQWH0DJDOKmHVH/LPD
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
1D7DEHODni representa a frequência absoluta do estrato i, isto é, o Q~PHURGHYH]HVTXHRHVWUDWRi aparece no rol, e fi representa sua frequência relativaLVWRpRSHUFHQWXDOGDIUHTXrQFLDDEVROXWDTXDQGRFRPSDUDGDFRPR número total de observações. $VWDEHODVGHIUHTXrQFLDDOpPGHSRVVLELOLWDUHPUiSLGDYLVXDOL]DomRGRV GDGRVQRVSHUPLWHPWLUDUDOJXPDVFRQFOXV}HVVLPSOHVPDVTXHSUHVFLQGHPGH organização. Exemplo 4.14. A tabela a seguir mostra a frequência de idades em uma amostra de 50 estudantes que responderam a um questionário sobre hábitos de lazer. 7$%(/$² IDADE
)RQWH0DJDOKmHVH/LPD
2EVHUYH TXH D YDULiYHO ´LGDGHµ p TXDQWLWDWLYD GLVFUHWD H TXH D 7DEHOD pPDLVFRPSOHWDTXHD7DEHODXPDYH]TXHWUD]XPDFROXQDDPDLV FRUUHVSRQGHQWHjIUHTXrQFLDUHODWLYDDFXPXODGDDWpDFODVVHi, denotada por Fi. Em geral, numa tabela organizada em k FODVVHV D IUHTXrQFLD UHODWLYD acumulada até a classe ipFDOFXODGDDVVLP
Série Novos Autores da Educação Profissional e Tecnológica
117
118
Capítulo IV - Estatística descritiva
'HSRVVHGD7DEHODGHIUHTXHQFLDVSRGHPRVFRQFOXLULPHGLDWDPHQWH TXHGRVHVWXGDQWHVWrPLGDGHPHQRURXLJXDODDQRV 1HVWH PRPHQWR FDEH UHVVDOWDU TXH XPD WDEHOD GH IUHTXrQFLD p XP LQVWUXPHQWRWpFQLFRHTXHSRUWDQWRVHJXHDOJXPDVHVSHFLÀFDo}HV7RGDWDEHOD GH IUHTXrQFLD GHYH WHU XP WtWXOR TXH JHUDOPHQWH p D YDULiYHO TXH HVWDPRV REVHUYDQGR H GHYH YLU DFRPSDQKDGD GD IRQWH GH RQGH DTXHODV LQIRUPDo}HV foram extraídas. Ela, em si mesma, deve comunicar todas as informações sem necessidade de complementação. Exemplo 4.15. O grupo de 50 estudantes do Exemplo 4.15, quando questionados sobre a quantidade de horas semanais dedicadas à atividade física, apresentou a seguinte distribuição de frequências. 7$%(/$²48$17,'$'('(+25$66(0$1$,6'(',&$'$6$7,9,'$'()Ì6,&$
)RQWH0DJDOKmHVH/LPD
$YDULiYHO´4XDQWLGDGHGHKRUDVVHPDQDLVGHGLFDGDVjDWLYLGDGHItVLFDµp TXDQWLWDWLYDFRQWtQXD'HYLGRjYDULHGDGHGHSRVVLELOLGDGHVGHLQIRUPDomRRV GDGRVIRUDPDJUXSDGRVHPFODVVHVTXHVmRLQWHUYDORVGHWHPSR$QRWDomRa b pHTXLYDOHQWHjQRWDomRGHLQWHUYDOR[a, b DSUHVHQWDGDQR&DStWXOR 1RWH TXH D DSUHVHQWDomR GDV LQIRUPDo}HV HP FODVVHV LQWHUYDODUHV WRUQD R WUDEDOKR PDLV RUJDQL]DGR H LQIRUPDWLYR ,VVR VHPSUH p SRVVtYHO TXDQGR
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
WUDEDOKDPRV FRP YDULiYHLV TXDQWLWDWLYDV FRQWtQXDV RX DLQGD FRP YDULiYHLV GLVFUHWDVTXHWRPDPPXLWRVYDORUHVGLVWLQWRV 9DPRV DSUHVHQWDU DJRUD XP FULWpULR SDUD GHÀQLU TXDQWDV FODVVHV GLVWLQWDV XWLOL]DUQXPDWDEHODGHGLVWULEXLomRGHIUHTXrQFLDVeLPSRUWDQWHUHVVDOWDUTXHQmRKi FRQVHQVRQHVWHDVVXQWRGDtDLPSRUWkQFLDGRHVWLORHGRERPVHQVRGRSHVTXLVDGRU 2VSDFRWHVFRPSXWDFLRQDLVHQWUHWDQWRYDOHPVHIUHTXHQWHPHQWHGRVGRLV FULWpULRVDSUHVHQWDGRVDVHJXLU3DUDFRPSUHHQGrORVFRQVLGHUHx (x1, x2, ..., xn um rol contendo as informações observadas. Considere ¨(x a amplitude de x, FRQIRUPHD'HÀQLomRHPTXHkpRQ~PHURGHFODVVHVTXHH[LVWLUmRQDWDEHOD GHIUHTXrQFLDHh o comprimento de cada classe. Teoricamente, esses elementos GDHVWUXWXUDGHXPDWDEHODGHIUHTXrQFLDVHUHODFLRQDPDVVLP
&ULWpULRGH6WXUJHV
2FULWpULRGH6WXUJHVGL]TXH k§1+,ORJn
Sendo k um número inteiro, deveremos fazer um arredondamento ou WUXQFDPHQWRFRQIRUPHDFRQYHQLrQFLD &ULWpULRGDUDL]TXDGUDGD
2FULWpULRGDUDL]TXDGUDGDGL]TXH k§¥n
Sendo k um número inteiro, deveremos fazer um arredondamento ou WUXQFDPHQWRFRQIRUPHDFRQYHQLrQFLD
4XDQGROLGDPRVFRPQ~PHURVGDIRUPDy 10xHPTXH[pXPQ~PHURUHDOTXDOTXHUGL]HPRVTXH o expoente x é o logaritmo de yQDEDVHHGHQRWDPRVHVVDVLWXDomRDVVLPx ORJy .
Série Novos Autores da Educação Profissional e Tecnológica
119
120
Capítulo IV - Estatística descritiva
De uma forma ou de outra, é possível encontrar uma aproximação UD]RiYHOSDUDk e hTXHVHDMXVWDPEHPDRUROGHLQIRUPDo}HV$PERVRVFULWpULRV determinam o número de classes, em função do número de informações GLVSRQtYHLV7RGDYLDRFULWpULRGH6WXUJHVpPDLVLQGLFDGRTXDQGRDGLPHQVmR do vetor xIRUPXLWRJUDQGHLVWRpTXDQGRQRUROFRQVWDUXPQ~PHURPXLWR grande de informações.
4.2 Gráficos 1DVXEVHomRDQWHULRUYLPRVXPLPSRUWDQWHWLSRGHWDEHODTXHDSDUHFH IUHTXHQWHPHQWHHPWUDEDOKRVWpFQLFRVDVFKDPDGDVWDEHODVGHIUHTXrQFLD$R lidarmos com tabelas, é importante conhecer bem sua estrutura, para poder LQWHUSUHWiODDSURYHLWDQGRWRGRVHXSRWHQFLDOLQIRUPDWLYR 8PDWDEHODVLPSOHVGHIUHTXrQFLDGHYDORUHVDVVXPLGRVSRUXPDYDULiYHO DOHDWyULD TXDOLWDWLYD SRGH JHUDU XP JUiÀFR GH VHWRUHV FRPR R PRVWUDGR QD )LJXUD 7$%(/$²&(5($,62/($*,126$6(/(*80,126$63$57,&,3$d®2'(352'8d®2 6(*81'2$6*5$1'(65(*,¯(6
)RQWH,%*(Primeiras estimativas da safra 2010.
2 FULWpULR GH 6WXUJHV p PDLV LQGLFDGR TXDQGR D GLPHQVmR GH x for muito grande, devido ao FUHVFLPHQWRGDIXQomRORJDUtWPLFDVHUPDLVOHQWRTXHDIXQomRUDL]TXDGUDGD,VVRVHUHÁHWHQXP PHQRUQ~PHURGHFODVVHVSDUDDWDEHODGHIUHTXrQFLD
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
),*85$²&(5($,62/($*,126$6(/(*80,126$63$57,&,3$d®2'(352'8d®2 6(*81'2$6*5$1'(65(*,¯(6 )RQWH)RQWH,%*(Primeiras estimativas da safra 2010.
2XWURVWLSRVGHWDEHODDSDUHFHPHPWUDEDOKRVWpFQLFRVPDVDLQWHUSUHWDomR de suas informações se processa de forma similar. A partir de uma tabela, podemos SURGX]LUGLYHUVRVWLSRVGHJUiÀFRV3RUH[HPSORFRQVLGHUHDWDEHODGD)LJXUDD VHJXLUTXHDSUHVHQWDIUHTXrQFLDVUHODWLYDVGHFDUDFWHUtVWLFDVFRQMXJDGDV
),*85$²3(5&(178$/'(3(662$6'($126280$,6'(,'$'(868É5,$6'( 7$%$&2)80$'2281®2)80$'23256(;26(*81'2$6*5$1'(65(*,¯(6 )RQWH,%*('LUHWRULDGH3HVTXLVDV&RRUGHQDomRGH7UDEDOKRH5HQGLPHQWRPesquisa Nacional por Amostra de Domicílios - 2008.
Série Novos Autores da Educação Profissional e Tecnológica
121
122
Capítulo IV - Estatística descritiva
3RUPHLRGHODSRGHPRVFRQVWUXLUXPJUiÀFRGHEDUUDVFRQIRUPHPRVWUD a Figura 4.4.
),*85$²3(5&(178$/'(3(662$6'($126280$,6'(,'$'(868É5,$6'( 7$%$&2)80$'2281®2)80$'23256(;26(*81'2$6*5$1'(65(*,¯(6² )RQWH,%*('LUHWRULDGH3HVTXLVDV&RRUGHQDomRGH7UDEDOKRH5HQGLPHQWRPesquisa Nacional por Amostra de Domicílios - 2008.
7DEHODV H JUiÀFRV FRP FDUDFWHUtVWLFDV FRQMXJDGDV VmR LPSRUWDQWHV SRLV DPSOLDPQRVVRROKDUVREUHRFRPSRUWDPHQWRFRQMXQWRGDTXHODVLQIRUPDo}HV possibilitando, inclusive, a observação de diferenças de comportamento por GLIHUHQWHVHVWUDWRVGHSRSXODomRRXDPRVWUDKHWHURJrQHD
4.3 Histogramas e distribuição da frequência 2 KLVWRJUDPD p XP JUiÀFR FRPSRVWR SRU UHWkQJXORV MXVWDSRVWRV TXH UHSUHVHQWDP D IUHTXrQFLD RX D IUHTXrQFLD UHODWLYD GRV YDORUHV DVVXPLGRV geralmente,SRUXPDYDULiYHOTXDQWLWDWLYDFRQWtQXD3DUDXPDYDULiYHOFRPWDLV HVSHFLÀFDo}HVVDEHPRVTXHDLQIRUPDomRDSUHVHQWDGDQDWDEHODGHIUHTXrQFLDVH HQFRQWUDDJORPHUDGDHPFODVVHVLQWHUYDODUHV$EDVHGHFDGDXPGRVUHWkQJXORV TXHFRPS}HPRKLVWRJUDPDGHXPDYDULiYHOFRUUHVSRQGHDRLQWHUYDORGHFODVVHH DVXDDOWXUDjUHVSHFWLYDIUHTXrQFLDRXIUHTXrQFLDUHODWLYD
0XLWDVYH]HVFRQVWUXLPRVKLVWRJUDPDVGHYDULiYHLVTXDQWLWDWLYDVGLVFUHWDVVREUHWXGRTXDQGRp PXLWRJUDQGHDTXDQWLGDGHGHGDGRV
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
4XDQGR RUJDQL]DPRV DV LQIRUPDo}HV SURYHQLHQWHV GH XPD YDULiYHO TXDQWLWDWLYDFRQWtQXDHPXPDWDEHODGHIUHTXrQFLDHID]HPRVXPDGLVWULEXLomR LQWHUYDODUGHVVDLQIRUPDomRHVWDPRVQDYHUGDGHDVVXPLQGRDKLSyWHVHGHTXH ela se distribui uniformemente pelo intervalo. Exemplo 4.16. 150 peixes mortos foram vítimas de contaminção de um rio e seu comprimento foi medido em milímetros. As medidas foram expressas na forma de tabela de frequência. 7$%(/$²&2035,0(17200 '(3(,;(6(1&2175$'26025726125,2
)RQWHKWWSOHJXISUEUaSDXORMXV
(VVDVLQIRUPDo}HVJHUDPRVHJXLQWHKLVWRJUDPD
),*85$²&2035,0(17200 '(3(,;(6(1&2175$'26025726125,2 )RQWHKWWSOHJXISUEUaSDXORMXV
Série Novos Autores da Educação Profissional e Tecnológica
123
124
Capítulo IV - Estatística descritiva
&RQVLGHUHDJRUDXPKLVWRJUDPDTXDOTXHUFRQVWUXtGRDSDUWLUGHXPURO x (x1, x2, ..., xn GHLQIRUPDo}HVGHXPDYDULiYHOTXDQWLWDWLYDFRQWtQXD6HMDP a1a2,a2a,,akak+1 os kLQWHUYDORVGHFODVVHHPTXHDLQIRUPDomRFRQWLGDHPx foi distribuída no PRPHQWRGDFRQVWUXomRGDWDEHODGHIUHTXrQFLD6HFRQVLGHUDUPRVmi o valor médio do intervalo de classe iHPDUFDUPRVQRKLVWRJUDPDDIUHTXrQFLDWHyULFDni relacionada a esse número, geraremos, ao unir todos os pontos (a1,0 ,(m1,n1 ,,(mk, nk ,(ak+1,0 , XPD ÀJXUD GHQRPLQDGD SROtJRQR GH IUHTXrQFLD FXMD iUHD TXH HOD GHWHUPLQD FRP R HL[R KRUL]RQWDO p DSUR[LPDGDPHQWH LJXDO DR VRPDWyULR GDV iUHDV GRV UHWkQJXORVTXHIRUPDPRKLVWRJUDPD4XDQGRRQ~PHURGHGDGRVGDDPRVWUD DXPHQWDLQGHÀQLGDPHQWHHRLQWHUYDORGHFODVVHWHQGHD]HURDIUHTXrQFLDWHQGH D VH FRQFHQWUDU QRV SRQWRV PpGLRV GDV FODVVHV H D GLVWULEXLomR GD IUHTrQFLD passa a ser uma função de densidade de probabilidades. $FRQVWUXomRGHKLVWRJUDPDVWHPFDUiWHUSUHOLPLQDUHPTXDOTXHUHVWXGR HpXPLPSRUWDQWHLQGLFDGRUGDGLVWULEXLomRGHGDGRV8PRXWURJUiÀFRPXLWR XWLOL]DGR SDUD FDSWXUDU R FRPSRUWDPHQWR FRQMXQWR GRV GDGRV p R JUiÀFR GH distribuição de frequências ou RJLYD $ WpFQLFD XWLOL]DGD SDUD HVERoiOR p D PHVPDXWLOL]DGDSDUDFRQVWUXLURKLVWRJUDPD$~QLFDGLIHUHQoDpTXHHPYH] GHSORWDUPRVDVLQIRUPDo}HVGHIUHTXrQFLDDEVROXWDRXGHIUHTXrQFLDUHODWLYD GHFDGDFODVVHLQIRUPDPRVDIUHTXrQFLDDEVROXWDDFXPXODGDRXDIUHTXrQFLD relativa acumulada em cada classe. No segundo caso, denominamos a ogiva de função de distribuição. Mediante o estudo do histograma ou da função de distribuição de um vetor, podemos reforçar ou reduzir a hipótese sobre a normalidade do comportamento desses dados, ou mesmo se esse comportamento é o resultado da misturaGHLQIRUPDo}HVTXHSRVVXHPFRPSRUWDPHQWRQRUPDO
1mRIDUHPRVHVVDGLVFXVVmRDTXL
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
4.4 Outros tipos de gráficos 1HVWDVHomRDSUHVHQWDUHPRVGRLVWLSRVGHJUiÀFRVEDVWDQWHWpFQLFRVR JUiÀFRGHUDPRVHIROKDV e o box plot7UDWDVHGHJUiÀFRVGHFRQVWUXomRVLPSOHV PDV TXH SRVVXHP JUDQGH FDSDFLGDGH GH UHYHODU DVSHFWRV LPSRUWDQWHV GH XP conjunto de dados. $SUHVHQWDUHPRVFRPRVHGiDFRQVWUXomRGHXPJUiÀFRGHUDPRVHIROKDV através de um exemplo. Exemplo 4.17. Suponha que as informações a seguir sejam o resultado de alguma característica numérica observada em uma amostra de uma população qualquer. 1 0 0
7 2 1
0 0 7
0 0
2 0 1
0 1 0
1
0
(VVDVLQIRUPDo}HVSRGHPVHUUHSUHVHQWDGDVDVVLP 3URIXQGLGDGH n 0 8QLGDGH:1
1R JUiÀFR RV Q~PHURV TXH HVWmR LPHGLDWDPHQWH j HVTXHUGD GD OLQKD vertical são denominados ramos H RV LPHGLDWDPHQWH j GLUHLWD IROKDV. Cada ramo tem uma profundidadeLQGLFDGDQDH[WUHPLGDGHHVTXHUGDGRJUiÀFRTXH FRUUHVSRQGHDRQ~PHURGHIROKDVTXHHOHFRQWpP 6mR RV YDORUHV QXPpULFRV GH FDGD LQIRUPDomR TXH FRPS}HP R JUiÀFR GHUDPRVHIROKDV$XQLGDGHORFDOL]DGDQRFDQWRVXSHULRUGLUHLWRGRJUiÀFR
Série Novos Autores da Educação Profissional e Tecnológica
125
126
Capítulo IV - Estatística descritiva
GHWHUPLQDFRPRVHUmRRVUDPRVXPDYH]TXHDVIROKDVVySRGHPVHUUHSUHVHQWDGDV por um número natural. Em nosso exemplo, como todos os dados são números QD FDVD GDV GH]HQDV D GH]HQD LQGLFDUi R UDPR H D XQLGDGH LQGLFDUi D IROKD RQGHVHUiODQoDGDHVVDLQIRUPDomR$VVLPDXQLGDGHGRUDPRpDGH]HQD3RU H[HPSORRGDGRHVWiUHSUHVHQWDGRSHODIROKDQRUDPR 'L]HPRVTXHDprofundidade do dadopDSRVLomRHPTXHDIROKDTXHR UHSUHVHQWDVHHQFRQWUDHPUHODomRjH[WUHPLGDGHPDLVSUy[LPDGRJUiÀFR3RU H[HPSORDLQIRUPDomRWHPSURIXQGLGDGH 2 JUiÀFR GH UDPRV H IROKDV SHUPLWH REVHUYDU FDUDFWHUtVWLFDV FRPR D SUHVHQoD GH GDGRV HVWUDQKRV D H[LVWrQFLD GH VLPHWULD QR FRQMXQWR GH GDGRV D GLVSHUVmR GRV GDGRV H D H[LVWrQFLD GH FRQFHQWUDo}HV GH LQIRUPDo}HV RX GH lacunas entre eles. -iRbox plotpXPDIHUUDPHQWDJUiÀFDTXHUHYHODDVSHFWRVLPSRUWDQWHVFRPR WHQGrQFLDFHQWUDOYDULDELOLGDGHVLPHWULDHH[LVWrQFLDGHYDORUHVDWtSLFRVoutliers). Dado o rol x (x1, x2, ..., xn , a construção do box plot para esse vetor de LQIRUPDo}HV EDVHLDVH QR UHJLVWUR HP HVFDOD GDV VHJXLQWHV PHGLGDV xmin, Q1, xmed, Q e xmaxHPTXHQ1, xmed e QVmRRVTXDUWLVGLVFXWLGRVQR&DStWXOR $ )LJXUD PRVWUD R GHVHQKR HVTXHPiWLFR GH XP box plot. A parte FHQWUDOGRJUiÀFRpFRPSRVWDGHXPDFDL[DFRPRQtYHOVXSHULRUGDGRSRUQ e o nível inferior por Q12WDPDQKRGDFDL[DpDPHGLGDGHGLVSHUVmR AIQ = |Q – Q1|, denominada amplitude interquartílica. A mediana é representada por um traço no interior da caixa e segmentos de reta são colocados da caixa até os valores Pi[LPRHPtQLPRREVHUYDGRV $PHGLGDGDDPSOLWXGHLQWHUTXDUWtOLFDSRGHVHUXVDGDSDUDDGHWHFomRGH valores atípicos. Um critério para a determinação se uma informação é ou não DWtSLFDpRVHJXLQWH xi é outlier se xi ! Q+1,AIQ ou se xj Q1²1,AIQ.
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
),*85$²%2;3/27&20%$6((0&,1&21Ô0(526 )RQWHÀFWtFLD
&RVWXPDVH LQGLFDU D SUHVHQoD GH outliers no box plot por meio de pontos acima das informações extremas. Assim, outliersVmRLQIRUPDo}HVTXHVH GLIHUHQFLDPWDQWRTXHVmRGHVSUH]DGDVSDUDHIHLWRGHDQiOLVH Exemplo 4.18. A tabela a seguir resume informações a respeito das alturas h de um grupo de 200 crianças de uma determinada escola, sendo 80 do sexo feminino e 120 do sexo masculino. 7$%(/$²0(','$65(6802
)RQWHÀFWtFLD
Série Novos Autores da Educação Profissional e Tecnológica
127
128
Capítulo IV - Estatística descritiva
A comparação do comportamento conjunto das alturas desses dois JUXSRVWRUQDVHPDLVIiFLODWUDYpVGRbox plot a seguir.
),*85$²$/785$'(&5,$1d$6'26(;2)(0,1,12) (0$6&8/,120 )RQWH7DEHOD
2ExemploQRVPRVWUDFRPRLGHQWLÀFDUQXPbox plotDH[LVWrQFLD de outliers7DQWRQRJUXSRGRVH[RPDVFXOLQRFRPRQRGRVH[RIHPLQLQRKiD presença de dois valores atípicos. No caso da meninas, duas alturas divergiram PXLWRSDUDPDLRUGRTXHHUDFRQVLGHUDGRQRUPDO1RFDVRGRVPHQLQRVXPD altura apresentou comportamento anormal para maior e outra para menor. (VVHV SRQWRV GLVFUHSDQWHV GLÀFLOPHQWH VHULDP GHWHFWDGRV VLPSOHVPHQWH REVHUYDQGRVHRVGDGRVDJUHJDGRVSRLVHOHVVmRLGHQWLÀFDGRVGHDFRUGRFRPD WHQGrQFLDFHQWUDOHDYDULDELOLGDGHGRJUXSRDRTXDOSHUWHQFHPeEHPSURYiYHO TXHXPDPHQLQDFXMDDOWXUDpGLVFUHSDQWHHPUHODomRjVRXWUDVPHQLQDVQmRVH GHVWDTXHHPUHODomRjDOWXUDGHWRGDVDVFULDQoDVSRLVDRLQFOXLUPHQLQRVD PHGLGDGHWHQGrQFLDFHQWUDOpDXPHQWDGD Esse exemplo vem mostrar também a utilidade do box plot como ferramenta GHDQiOLVHPXOWLYDULDGDSHUPLWLQGRFRPSDUDUSRSXODo}HVGHWDPDQKRVGLVWLQWRV
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
5 Resumo das etapas do trabalho estatístico 'LDQWHGDQHFHVVLGDGHGHLQYHVWLJDomRGHDOJXPDFDUDFWHUtVWLFDRXYDULiYHO GHÀQLGDHPXPDSRSXODomRTXDOTXHUGHYHPRVGDULQtFLRDXPULJRURVRWUDEDOKR TXHHQYROYHURWLQDVSUHHVWDEHOHFLGDVRWUDEDOKRHVWDWtVWLFR 1HVWDVHomRUHVXPLUHPRVDVIDVHVGRWUDEDOKRHVWDWtVWLFRHP 3ODQHMDPHQWR &ROHWDGHGDGRV 3. Tratamento dos dados $QiOLVHGRVUHVXOWDGRV 1DIDVHGRSODQHMDPHQWRSUHFLVDPRV GHÀQLU R SUREOHPD RX VHMD VDEHU H[DWDPHQWH R TXH SUHWHQGHPRV SHVTXLVDU GHÀQLUFRPROHYDQWDUDVLQIRUPDo}HVHTXHGDGRVHVSHUDPRVHQFRQWUDU GHÀQLU TXH WLSR GH OHYDQWDPHQWR IDUHPRV VH XP FHQVR RX XP levantamento por amostragem; GHÀQLU QR FDVR GH OHYDQWDPHQWR SRU DPRVWUDJHP TXDO R WLSR GH DPRVWUDJHPpPDLVDSURSULDGRSDUDRTXHSUHWHQGHPRVSHVTXLVDU GHÀQLUXPFURQRJUDPDGHDWLYLGDGHV GHÀQLURVFXVWRVGDRSHUDomR Na segunda fase, precisamos ir a campo e coletar as informações. Essa é XPDHWDSDRSHUDFLRQDOHGHYHVHUIHLWDGHIRUPDPXLWRVLVWHPiWLFDHSDGURQL]DGD VHJXQGRFULWpULRVGHDERUGDJHPGDVXQLGDGHVSUHYLDPHQWHGHÀQLGRVQDHWDSD do planejamento.
Série Novos Autores da Educação Profissional e Tecnológica
129
130
Capítulo IV - Estatística descritiva
2VGDGRVFROHWDGRVVmRFODVVLÀFDGRVGHDFRUGRFRPDGLVWkQFLDHPTXH se encontram da fonte geradora. São chamados de primáriosTXDQGRREWLGRV GLUHWDPHQWHGDSUySULDHPSUHVDRXRUJDQL]DomRTXHRVSURGX]LXHsecundários, TXDQGRREWLGRVGHHPSUHVDRXRUJDQL]DomRTXHQmRDTXHODTXHRVSURGX]LX 3DUD ÀFDU PDLV FODUR TXDQGR FRQVXOWDPRV R site RÀFLDO GR ,%*( H DFHVVDPRV LQIRUPDo}HV UHVXOWDQWHV GH XPD SHVTXLVD UHDOL]DGD H GLYXOJDGD SRU HVVD LQVWLWXLomR HVWDPRV QD YHUGDGHXWLOL]DQGR GDGRV SULPiULRV 4XDQGR HP YH] GLVVRDFHVVDPRVXPDLQIRUPDomRGHVVDPHVPDSHVTXLVDUHDOL]DGDSHOR,%*( HPXPDUHYLVWD[HVWDPRVXWLOL]DQGRGDGRVVHFXQGiULRV $XWLOL]DomRGHGDGRVSULPiULRVpPDLVVHJXUDSRLVGLPLQXLRVULVFRVGH HUURVGHYLGRVjWUDQVFULomRGDVLQIRUPDo}HV 2WLSRPDLVFRPXPGHGDGRpDTXHOHREWLGRSRUcoleta direta2VGDGRV fornecidos pelo IBGE são, em geral, obtidos assim. São comuns, no meio HPSUHVDULDO SHVTXLVDV HQYROYHQGR D FROHWD GLUHWD GH LQIRUPDo}HV MXQWR DRV FRQVXPLGRUHVVREUHVXDVSUHIHUrQFLDVGHFRQVXPR2XHPSHVTXLVDVHOHLWRUDLV HPTXHDRSLQLmRGRVHOHLWRUHVpFROHWDGDSDUDÀQVGHSUHYLVmRGRVUXPRVGD eleição. Uma vez realizada a coleta de dados, é preciso tratar as informações, RUJDQL]DQGRDV PHGLDQWH FRQWDJHP H DJUXSDPHQWR 1HVVD IDVH p QHFHVViULR TXHVHIDoDXPDFUtWLFDDRVGDGRVFRPDÀQDOLGDGHGHHYLWDURTXHVHFKDPDGH contaminação(VVDFUtWLFDpIHLWDGHVFDUWDQGRVHDVLQIRUPDo}HVREVFXUDVVHMDP SRUIDOKDVQRSURFHVVRGHFROHWDGHUHJLVWURRXGHHTXtYRFRVJHUDGRVSRUPi interpretação. Normalmente, é feita uma condensação dessas informações em planilhas ou tabelas. Estatísticas (medidas) são calculadas, com o objetivo de caracterizar DTXHOHFRQMXQWRGHLQIRUPDo}HVHJUiÀFRVVmRSURGX]LGRV (VVDVWUrVSULPHLUDVIDVHVVmRRTXHGHQRPLQDPRVGH(VWDWtVWLFD'HVFULWLYD $ TXDUWD IDVH TXH HQYROYH WpFQLFDV PDLV HODERUDGDV p D IDVH PDLV UHÀQDGD GHOLFDGDHLPSRUWDQWHGRWUDEDOKRHVWDWtVWLFR7UDWDVHGDDQiOLVHHLQWHUSUHWDomR GRVGDGRVTXHpRREMHWLYRGD(VWDWtVWLFD,QIHUHQFLDO$WUDYpVGRVVHXVPpWRGRV a Estatística Inferencial permite induzir conclusões ou fazer previsões, com erro controlado.
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
3RUVLVyDDQiOLVHJUiÀFDpXPLQVWUXPHQWRTXHSRVVLELOLWDWLUDUDOJXPDV FRQFOXV}HVVREUHRIHQ{PHQRRXDYDULiYHOHVWXGDGRV0DVH[LVWHPPXLWDVRXWUDV WpFQLFDVHODERUDGDVSHOD(VWDWtVWLFD,QIHUHQFLDOTXHFRQIRUPHGLWRDQWHULRUPHQWH não são objetos deste curso.
Exercícios ,)* $R QDVFHUHP RV EHErV VmR SHVDGRV H PHGLGRV SDUD VH VDEHU se estão dentro dos padrões de peso e altura esperados. Essas duas YDULiYHLV D b) c) d) e)
VmRDPEDVTXDOLWDWLYDV são contínua e discreta, respectivamente. são discreta e contínua, respectivamente. são ambas, discretas. são ambas, contínuas.
,)* 1XPD GHWHUPLQDGD HPSUHVD IRL UHDOL]DGD XPD SHVTXLVD D UHVSHLWRGRVVDOiULRVGRVIXQFLRQiULRVHPFRPSDUDomRFRPRVDOiULR PtQLPRDWXDOHIRUDPREWLGRVRVGDGRVVHJXLQWHV
&RPEDVHQHVVHVGDGRVSRGHVHDÀUPDUTXH a) uma mediana é obtida através da média aritmética entre os HOHPHQWRVH E GRVIXQFLRQiULRVJDQKDPHPPpGLDVDOiULRVPtQLPRV F DPpGLDVDODULDOpGHVDOiULRVPtQLPRV G pRSULPHLURTXDUWLO H RQ~PHURGHIXQFLRQiULRVFRPVDOiULRLQIHULRUDVDOiULRVPtQLPRVp GH
Série Novos Autores da Educação Profissional e Tecnológica
131
132
Capítulo IV - Estatística descritiva
6XSRQKDPRV TXH XPD HPSUHVD GHVHMD DYDOLDU D GLVWULEXLomR GRV VDOiULRVSDJRVSRUKRUDDVHXVIXQFLRQiULRV 1,
11,
10,
1,2
12,
11,
12,
10,7
12,
1,
12,
12,
,
,7
11,
10,
12,1
10,
1,2
1,
,
10,
1,
,
1,
,
,
10,2
12,
12,2
D &RQVWUXDXPDWDEHODGHIUHTXrQFLDVFRPSOHWDFRQWHQGRFROXQDV SDUD D IUHTXrQFLD DEVROXWD D IUHTXrQFLD DEVROXWD DFXPXODGD D IUHTXrQFLDUHODWLYDHDIUHTXrQFLDUHODWLYDDFXPXODGD E &RQVWUXD XP KLVWRJUDPD D SDUWLU GD IUHTXrQFLD DEROXWD H RXWUR KLVWRJUDPDDSDUWLUGDIUHTXrQFLDUHODWLYD4XDODUHODomRH[LVWHQWH HQWUHHVVHVGRLVJUiÀFRV" c) Usando a mesma técnica de construção do histograma, construa um JUiÀFRSDUDDIUHTXrQFLDDEVROXWDDFXPXODGDHRXWURSDUDDIUHTXrQFLD UHODWLYDDFXPXODGD4XDODUHODomRH[LVWHQWHHQWUHHVVHVGRLVJUiÀFRV" 2 EDUXOKR p PHGLGR HP GHFLEpLV UHSUHVHQWDGRV SRU G% 8P GHFLEHO FRUUHVSRQGHDRQtYHOGHVRPPDLVIUDFRTXHSRGHVHURXYLGRSRUXPD pessoa de boa audição num ambiente silencioso. Um susurro corresponde DG%DYR]KXPDQDHPFRQYHUVDomRQRUPDOSURGX]FHUFDGHG% XPUiGLRFRPYROXPHDOWRSURGX]FHUFDGHG%2GHVFRQIRUWRSDUD RV RXYLGRV RFRUUH JHUDOPHQWH D SDUWLU GH G% 2V GDGRV D VHJXLU FRUUHVSRQGHPDPHGLo}HVGREDUXOKRHPGLIHUHQWHVKRUiULRVQXP determinado local. 2
0
7
11
120
77
100
7
12
11
102
12
7
100
10
121
10
72
7
10
7
102
102
12
122
110
a) Construa o diagrama de ramos e folhas para esses dados. b) Construa um box plot para esse conjunto de dados.
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
6XSRQKDTXHXPSURGXWRUGHODUDQMDVTXHFRVWXPDJXDUGDUDVIUXWDV HPFDL[DVHVWiLQWHUHVVDGRHPHVWXGDURQ~PHURGHODUDQMDVSRUFDL[D 'HSRLVGHXPGLDGHFROKHLWDFDL[DVIRUDPFRQWDGDV2VUHVXOWDGRV foram armazenados no vetor y (22,2,,,,7,,,,,,,2,,,7,1,2,7, Esboce um box plot para o vetor y.
)*9 $V LQIRUPDo}HV QD WDEHOD D VHJXLU UHIHUHPVH DR Q~PHUR GH UHFODPDo}HV QD $QDWHO SRU DFHVVRV HP VHUYLoR UHIHUHQWHV DR SHUtRGRGHoDGHDJRVWRGH
)RQWH$QDWHO
2GLDJUDPDGHFDL[DER[SORW TXHPHOKRUUHSUHVHQWDHVVHVGDGRVp a)
b)
Série Novos Autores da Educação Profissional e Tecnológica
133
134
Capítulo IV - Estatística descritiva
c)
d)
e)
Série Novos Autores da Educação Profissional e Tecnológica
CAPÍTULO V NOÇÕES DE PROBABILIDADE
Probabilidade e Estatística: um curso introdutório
Noções de probabilidade
No capítulo anterior, foram mostrados alguns conceitos relacionados j (VWDWtVWLFD 'HVFULWLYD 1HVWH FDStWXOR DSUHVHQWDPRV D EDVH WHyULFD SDUD R desenvolvimento de técnicas da Estatística Inferencial, a serem desenvolvidas em estudos posteriores. 9DPRVFRQVLGHUDUDVVHJXLQWHVTXHVW}HV&RPRVDEHUVHXPGHWHUPLQDGR SURGXWRHVWiVHQGRSURGX]LGRGHQWURGRVSDGU}HVGHTXDOLGDGH"&RPRDYDOLDU D FDSDFLGDGH GH XP GHWHUPLQDGR H[DPH DFHUWDU R YHUGDGHLUR GLDJQyVWLFR" 4XHVW}HVFRPRHVVDVHQYROYHPDOJXPWLSRGHYDULDELOLGDGHRXLQFHUWH]DHDV GHFLV}HVSRGHPVHUWRPDGDVSRUPHLRGDWHRULDGHSUREDELOLGDGHVTXHSHUPLWH DTXDQWLÀFDomRGDLQFHUWH]D $VHJXLUYHUHPRVDOJXQVFRQFHLWRVEiVLFRVGHSUREDELOLGDGH
Série Novos Autores da Educação Profissional e Tecnológica
137
138
Capítulo V - Noções de probabilidade
1 Alguns conceitos básicos Estamos interessados em estudar IHQ{PHQRVDOHDWyULRVLVWRpDTXHOHVTXH PHVPRUHDOL]DGRVVREDVPHVPDVFRQGLo}HVHFLUFXQVWkQFLDVSRGHPUHVXOWDUHP observações distintas. Exemplo 5.1. Um dado será lançado sucessivas vezes e a face de cima será observada. eFODURTXHRVSRVVtYHLVUHVXOWDGRVGHFDGDODQoDPHQWRQR([HPSOR VmRPDVQmRSRGHPRVDÀUPDUTXDOVHUiRUHVXOWDGRGHXPODQoDPHQWR TXDOTXHU$VVLPRIHQ{PHQR´ODQoDPHQWRGHXPGDGRVXFHVVLYDVYH]HVµpXP fenômeno aleatório. 2FRQMXQWRGHWRGRVRVUHVXOWDGRVSRVVtYHLVGHXPIHQ{PHQRDOHDWyULR é chamado de espaço amostral 1R FDVR SDUWLFXODU GR ([HPSOR R HVSDoR amostral ƺGDTXHOHIHQ{PHQRDOHDWyULRp ƺ {(w1,w2, ,wi{1,2,,`,SDUDWRGRiN` Cada vetor w (w1,w2, ƺ corresponde a uma possível realização do fenômeno ou experimento. Exemplo 5.2. O tempo de reação de um antibiótico aplicado em um animal doente é um fenômeno aleatório cujo espaço amostral ƺ {t R,t t 0 . 8PVXEFRQMXQWR TXDOTXHU GRHVSDoRDPRVWUDO ƺ é dito ser um evento desse espaço. Geralmente, representamos eventos por letras maiúsculas. Em particular, se A e B são eventos de ƺ, então A B, A B, A ² B e Ac também o são. Dois eventos de ƺ são mutuamente exclusivosTXDQGRDRFRUUrQFLDGHXP LPSHGHDRFRUUrQFLDGRRXWUR1HVWHFDVRA B Ø.
Se A é um subconjunto de ƺ, então representamos a diferença ƺ²A por AcHGL]HPRVTXHAc é o
complemento de A UHODWLYRjƺ.
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
Exemplo 5.3 Uma moeda será lançada duas vezes e a face de cima observada. O espaço amostral referente a esse fenômeno aleatório é ƺ0 {(k, k ,(k, c ,(c, k ,(c, c `, onde k representa cara e c, coroa. Os conjuntos A {FDUDQDSULPHLUDHQWUDGD` {(k, k ,(k, c ` e B {FDUDQDVHJXQGDHQWUDGD` {(k, k ,(c, k ` são eventos de ƺ0. 8PTXHVWLRQDPHQWRQDWXUDODHVVDDOWXUDVHULDGLDQWHGHXPH[SHULPHQWR DOHDWyULRTXDOpDFKDQFHGHRFRUUHUGHWHUPLQDGRHYHQWR"1DSUy[LPDVHomR nos ocuparemos em encontrar uma maneira de medir essa chance.
2 Medidas de probabilidade ,QWURGX]LPRV HVWD VHomR FRP XPD UiSLGD GLVFXVVmR VREUH DV FRQFHSo}HVÀORVyÀFDVHPWRUQRGRFRQFHLWRGHprobabilidade. Intuitivamente, entenderemos por probabilidade uma maneira de se medir a chance de um evento acontecer. +LVWRULFDPHQWHKiWUrVPDQHLUDVGLVWLQWDVGHVHFRQFHEHUSUREDELOLGDGH através dos métodos clássico, frequentista e bayesiano 2V GRLV SULPHLURV VmR também chamados de métodos objetivos, por se basearem, respectivamente, em UHVXOWDGRVLJXDOPHQWHSURYiYHLVHGDGRVKLVWyULFRVR~OWLPRpWDPEpPFKDPDGR GHPpWRGRVXEMHWLYRSRUVHYDOHUGHFUHQoDVRXGDKDELOLGDGHGRSHVTXLVDGRU para ser estabelecido. 2 HQIRTXH GR PpWRGR D VHU XWLOL]DGR YDULD GH DFRUGR FRP D VLWXDomR $SUHVHQWDUHPRVDVHJXLUDGHÀQLomRGHSUREDELOLGDGHVHJXQGRFDGDXPGHVVHV
Série Novos Autores da Educação Profissional e Tecnológica
139
140
Capítulo V - Noções de probabilidade
HQIRTXHVHDVVXPLUHPRVTXHDVQRo}HVFRQYHUJHPHPDOJXPVHQWLGRSDUDXP REMHWRPDWHPiWLFREHPGHÀQLGRDSUHVHQWDGRPDLVDGLDQWH Em cada uma das subseções seguintes, considere ƺ um espaço amostral.
2.1 O método clássico 2PpWRGRFOiVVLFREDVHLDVHQXPIDWRFRQWURYHUVRGHTXHFDGDHOHPHQWR do espaço amostral ƺ é equiprovávelLVWRpWHPDPHVPDFKDQFHGHRFRUUrQFLD Exemplo 5.4. Um dado é não viciado quando, ao ser lançado, as chances de sair qualquer uma das faces são iguais. Portanto, ao considerar um dado não viciado, estamos, na verdade, adotando um método clássico para definir as chances de os eventos relacionados ao experimento “lançamento de um dado e observação da face de cima” ocorrerem. 'HDFRUGRFRPRPpWRGRFOiVVLFRDSUREDELOLGDGHGHRFRUUrQFLDGHXP evento A ƺTXHGHQRWDUHPRVSRUP(A , é
(VVD FRQFHSomR GH SUREDELOLGDGH p FRQWURYHUVD QD PHGLGD HP TXH HOD XWLOL]D FRPR SUHVVXSRVWR H[DWDPHQWH R TXH HOD SUHFLVD GHÀQLU PDV IXQFLRQD EHPTXDQGROLGDPRVFRPFRQMXQWRVÀQLWRV 'HTXDOTXHUPDQHLUDpIiFLOYHUTXHRFRQFHLWRGHSUREDELOLGDGHFOiVVLFR H[SULPHXPDFRPSDUDomRHQWUHRHYHQWRHRHVSDoRDPRVWUDOLVWRpGiXPD idéia de peso (porcentagem) do evento no espaço amostral. Exemplo 5.5. Considere os eventos A e B do espaço amostral ƺ0 do Exemplo 5.3. Na hipótese de a moeda ser equilibrada, isto é, não favorecer nenhum dos resultados, teremos que
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
2.2 O método frequentista $VLWXDomRDSUHVHQWDGDQR([HPSORQDSUiWLFDpUDUD,VVRSRUTXH a moeda pode ter sido intensionalmente desgastada, favorecendo um UHVXOWDGR2XPHVPRRHTXLSDPHQWRTXHDSURGX]LXSRGHHVWDUGHVFDOLEUDGR e QHVVH DVSHFWR TXH VH LQVHUH R PpWRGR IUHTXHQWLVWD TXH VH EDVHLD QR histórico de resultados do experimento para determinar a probabilidade P(A do evento A
Exemplo 5.6. Um jogo praticado numa banca é tal que, nos 10 lançamentos da moeda, saíram 8 caras. Então, pela abordagem frequentista, a probabilidade de sair cara no próximo lançamento é de aproximadamente 4/5. 3DUDVHUPRVSUHFLVRVVHJXQGRRFRQFHLWRIUHTXHQWLVWD
HP TXH nA representa o número de ensaios (repetições do experimento) nos TXDLVRHYHQWRA foi observado em n realizações do experimento e a expressão limkńxk representa, intuitivamente, um comportamento limite para a expressão xk TXDQGRRkFUHVFHLQGHÀQLGDPHQWH $VVLP R FiOFXOR GH P(A é baseado na repetição do experimento ou KLVWyULFRGHUHSHWLo}HV$FUHGLELOLGDGHGHVVHUHVXOWDGRGHSHQGHUiGRTXDQWRR SDVVDGRGRSURFHVVRDOHDWyULRpUHSUHVHQWDWLYRGRIXWXURHHVVDGHSHQGrQFLD QHPVHPSUHpDOWDRXVHTXHUSRGHH[LVWLU /LPLWDo}HVGHVVDDERUGDJHPRFRUUHPWDPEpPHPVLWXDo}HVQDVTXDLV QmRpSRVVtYHOUHDOL]DULQÀQLWRVHQVDLRVGRSURFHVVR1DSUiWLFDLVVRQXQFDp SRVVtYHO
$GHÀQLomRIRUPDOGHOLPLWHSRGHVHUHQFRQWUDGDHP>@
Série Novos Autores da Educação Profissional e Tecnológica
141
142
Capítulo V - Noções de probabilidade
2.3 O método bayesiano 2 PpWRGR ED\HVLDQR HVWi DVVHQWDGR QXP HQIRTXH VXEMHWLYR GD SUREDELOLGDGH1HOHKiDIRUPXODomRGHPRGHORVFXMDYHULÀFDomRpEDVHDGDQD FRPELQDomRGHHYLGrQFLDVH[SHULPHQWDLVFRPDLQWXLomRGRSHVTXLVDGRU3RUHVVH PpWRGRGHÀQHVHDSUREDELOLGDGHVXEMHWLYDFRPRVHQGRXPDPHGLGDGRJUDX GHFRQÀDQoDGHXPDSHVVRDHPUHODomRDXPDSURSRVLomR>@(ODpIXQomRGD TXDQWLGDGHGHLQIRUPDomRGHTXHDSHVVRDGLVS}HHSRVVXLDUHVWULomRGHTXH GHYHREGHFHUDFULWpULRVGHFRQVLVWrQFLDHDRVD[LRPDVGDSUREDELOLGDGH &RPR GLVVHPRV DSHVDU GDV GLYHUVDV FRQFHSo}HV ÀORVyÀFDV HP DOJXP VHQWLGRWRGDVHODVFRQYHUJHPSDUDXPREMHWRPDWHPiWLFREHPGHÀQLGRHTXH apresentaremos na próxima seção.
2.4 Definição de probabilidade Formalmente, uma medida de probabilidade3 é uma função P(. TXHDVVRFLD números reais a eventos do espaço amostral e satisfaz as seguintes condições, GHQRPLQDGDVD[LRPDVGDSUREDELOLGDGH 0P(A 1SDUDTXDOTXHUHYHQWRA;4 P(ƺ 1 e P(Ø 0;5 3.
SDUDTXDLVTXHUA1,,An disjuntos.
2V D[LRPDV DSUHVHQWDGRV QHVVD GHÀQLomR UHIHUHPVH DR TXH p FKDPDGR GH SUREDELOLGDGH ÀQLWDPHQWH DGLWLYD 3DUD XP HVWXGR PDWHPDWLFDPHQWH PDLV DSURIXQGDGR R $[LRPD TXH GL] UHVSHLWRjDGLWLYLGDGHÀQLWDGHYHVHUVXEVWLWXtGRSRUXPVLPLODUTXDOVHMD 3
SDUDTXDLVTXHUA1, A2, ... disjuntos. Esse axioma poderia ser reduzido a apenas P(A 0 TXH R IDWR GH P(A 1 surgiria como FRQVHTXrQFLD
4
5
Na verdade, P(Ø 0 decorre do fato de P(ƺ 1 e dos outros dois axiomas.
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
Exemplo 5.7. Considere ƺ um espaço amostral de cardinalidade finita e defina a função
2EVHUYHTXHSDUDDIXQomRP0VmRVDWLVIHLWRVRVWUrVD[LRPDVGDSUREDELOLGDGH 'HIDWRQRWHSULPHLUDPHQWHTXHSHODGHÀQLomRGHP0(.)WHPRVTXH
e
R TXH YHULÀFD R $[LRPDV QD GHÀQLomR GH SUREDELOLGDGH VH A é um evento TXDOTXHU GH ƺ, então Ø A ƺ /RJR #Ø #A #ƺ. Dividindo todos os membros dessa desigualdade por #ƺ, teremos 0P0(A 1TXDOTXHUTXHVHMDA. ,VVRYHULÀFDR$[LRPD3RUÀPVHFRQVLGHUDUPRVA1, A2, ..., An eventos de ƺ, tais TXHA1 A2 ... An = Ø, então #(A1A2An = #(A1 +#(A2 +#(An Assim,
R TXH PRVWUD TXH P0(. VDWLVID] R $[LRPD /RJR P0(. é uma medida de probabilidade.
Série Novos Autores da Educação Profissional e Tecnológica
143
144
Capítulo V - Noções de probabilidade
Exemplo 5.8. Considere ƺum espaço amostral que possa ser identificado como uma região de área finita e defina a função
2EVHUYH TXH D IXQomR P1 WDPEpP VDWLVID] RV TXDWUR D[LRPDV GD SUREDELOLGDGH'HIDWRSHODGHÀQLomRGHP1( , e
MiTXHXPFRQMXQWRYD]LRQmRWHPiUHDRTXHYHULÀFDR$[LRPDQDGHÀQLomR de probabilidade; analogamente ao ExemplopIiFLOYHUTXH0P1(A 1, TXDOTXHUTXHVHMDA,VVRYHULÀFDR$[LRPD3RUÀPVHFRQVLGHUDUPRVA1, A2, ..., An eventos de ƺWDLVTXHA1 A2 ... An = Ø, então iUHDGH(A1A2An =iUHDGH A1+iUHDGH A2+iUHDGH An Assim,
RTXHPRVWUDTXHP1(. VDWLVID]R$[LRPD/RJRP1(. é também uma medida de probabilidade.
eFODURTXHDiUHDGHXPFRQMXQWRYD]LRp]HUR1RHQWDQWRGLIHUHQWHPHQWHGDPHGLGD#(. , na TXDO R ~QLFR FRQMXQWR FRP PHGLGD YD]LD HUD R Ø, para a medida iUHD GH (. Ki LQÀQLWRV RXWURV VXEFRQMXQWRVQmRYD]LRVFXMDPHGLGDp]HUR3RUH[HPSORTXDOTXHUVXEFRQMXQWRGLVFUHWRGHƺ ou PHVPRVHJPHQWRVGHUHWDOLQKDVFXUYDVLVWRpVXEFRQMXQWRVTXHQmRGHOLPLWDPiUHDDOJXPD
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
$VVLPÀFDSURYDGRTXHPHGLGDVGHSUREDELOLGDGHH[LVWHPRXVHMDWUDWD VHGHXPREMHWRPDWHPiWLFREHPGHÀQLGR A seguir, discutiremos algumas propriedades importantes das medidas de SUREDELOLGDGHTXHGHFRUUHPGDGHÀQLomRDSUHVHQWDGDQHVWDVHomR$VVXPLUHPRV TXHRHVSDoRDPRVWUDOƺ se encontra munido de uma medida de probabilidade P(. GHÀQLGDVREUHRFRQMXQWR(ƺ
3 Propriedades operatórias
3.1 Monotonicidade da probabilidade A probabilidade é uma função monótona não decrescente, no sentido TXHVHA1 ƺ, então P(A1 P(A2 . Isso pode ser facilmente visto a partir dos D[LRPDVHTXHGHÀQHPDSUREDELOLGDGH 'HIDWRQRWHTXHSRGHPRVUHHVFUHYHURFRQMXQWRA2 como a união disjunta A1 (A2²A1 A1 daí, P(A1 P((A2²A1 A1 P(A2²A1 P(A1 , HPTXHD~OWLPDLJXDOGDGHpJDUDQWLGDSHOR$[LRPDSRUWHUPRVQRDUJXPHQWR GDIXQomRSUREDELOLGDGHXPDXQLmRGLVMXQWDGHHYHQWRV3HOR$[LRPDP(A2² A1 0RTXHID]FRPTXHGHIDWRP(A1 P(A2 .
3.2 Probabilidade de não ocorrência de um evento Seja ƺ um espaço amostral e considere AXPHYHQWRTXDOTXHU&RPRAc ƺ, WHPRVTXHAc é também evento de ƺ, dito ser o complementar do evento A.
1HVVDV FRQGLo}HV GL]HPRV TXH R HVSDoR (ƺ, ƺ , P( é um espaço de probabilidade. Por simplicidade, estamos considereando ƺ: (ƺ,ƺ ,P( .
Série Novos Autores da Educação Profissional e Tecnológica
145
146
Capítulo V - Noções de probabilidade
eFRPXPHVWDUPRVLQWHUHVVDGRVHPDQDOLVDUDQmRRFRUUrQFLDGRHYHQWR A, isto é, a P(Ac . Como ƺ AAc e A e Ac HYHQWRV GLVMXQWRV WHPRV SHORV D[LRPDV H GD GHÀQLomR GH SUREDELOLGDGHTXH 1 P(ƺ P(AAc P(A +P(Ac $VVLPGHPRQVWUDPRVDVHJXLQWHSURSRVLomR Proposição 5.1. Se Ac for o evento complementar de A, então P(A 1²P(Ac . Essa proposição pode ser enunciada mais geralmente, considerando uma partição TXDOTXHU GR FRQMXQWR ƺ. Por partição de um conjunto entendemos TXDOTXHU FROHomR ÀQLWD GH FRQMXQWRV GLVMXQWRV FXMD XQLmR UHVXOWD QR SUySULR FRQMXQWR3DUDVHUPRVSUHFLVRVDSUHVHQWDPRVDVHJXLQWHGHÀQLomR 'HÀQLomR Seja ƺ um conjunto não vazio. Se P {ƺ1, ƺ2, , ƺn` é formado por subconjuntos de ƺWDLVTXH ƺ1ƺ2ƺn Ø e
HQWmRGL]HPRVTXHP é uma partição de ƺ. $VHJXLUDSUHVHQWDPRVXPDJHQHUDOL]DomRSDUDD3URSRVLomR Proposição 5.2. Seja P {ƺ1, ƺ2, , ƺn` uma partição de um espaço amostral ƺ. Então, para qualquer 1in,
Se
é uma união disjunta, então
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
WDPEpPVHUiXPDXQLmRGLVMXQWD'DtVHJXHTXH
Isso prova um importante resultado chamado de 7HRUHPDGDSUREDELOLGDGHWRWDO. 7HRUHPD (Teorema da probabilidade total). Seja P {ƺ1,ƺ2,,ƺn` uma partição de um espaço amostral ƺ e A um evento qualquer de ƺ. Então,
3.3 Probabilidade da união qualquer de eventos 2 $[LRPD GD GHÀQLomR GH SUREDELOLGDGH GL] FRPR SURFHGHU SDUD VH FDOFXODUDSUREDELOLGDGHGDVRPDGHHYHQWRVGLVMXQWRV-iD3URSRVLomRGL] FRPRFDOFXODUDSUREDELOLGDGHGHXPHYHQWRTXHSHUWHQFHDXPDSDUWLomRGH ƺ$JRUDGDGRVGRLVHYHQWRVTXDLVTXHUQmRQHFHVVDULDPHQWHGLVMXQWRVFRPR FDOFXODU D SUREDELOLGDGH GD RFRUUrQFLD GD XQLmR GHVVHV HYHQWRV" 2 SUy[LPR UHVXOWDGRUHVSRQGHDHVVDTXHVWmR $QWHVGHHVWDEHOHFrORSRUpPp~WLOREVHUYDUTXHXPGDGRFRQMXQWRM sempre pode ser escrito como uma união disjunta em função de outro conjunto nTXDOTXHUGDVHJXLQWHIRUPD M (MN (MNc
7HRUHPD Dado dois eventos A e B, a probabilidade de, pelo menos, um deles ocorrer é igual a soma das probabilidades de cada um menos a probabilidade de ambos ocorrerem simultaneamente, ou seja: P(AB P(A +P(B ²P(AB
Série Novos Autores da Educação Profissional e Tecnológica
147
148
Capítulo V - Noções de probabilidade
Demonstração:%DVWDQRWDUTXH AB (ABc (AB (B Ac ,
H TXH HVVD XQLmR p GLVMXQWD 'H IDWR SHOD (TXDomR H SHOR $[LRPD GD SUREDELOLGDGHWHPRVTXH P(A P(AB + P(ABc
(5.3)
P(B P(AB + P(AcB
(5.4)
e
6RPDQGRDVHTXDo}HVHREWHPRV P(A +P(B 2P(AB + P(ABc + P(AcB Daí,
P(A +P(B ²P(AB P(AB + P(ABc + P(AcB P(AB (ABc (AcB P(AB ,
VHQGR TXH D ~OWLPD LJXDOGDGH RFRUUH SRU $VVLP ÀFD HVWDEHOHFLGR R resultado. Em particular, se A e B são mutuamente exclusivos, então P(AB 0/RJR P(AB P(A +P(B Exemplo 5.9. Um estudo realizado por uma empresa de recursos humanos mostrou que 45% dos funcionários de uma multinacional saíram da empresa porque estavam insatisfeitos com seus salários; 28% porque consideraram que a empresa não possibilitava o crescimento profissional; e 8% indicaram insatisfaçãoo tanto com o salário como com sua impossibilidade de crescimento profissional. Considere o evento S: “o funcionário sai da empresa em razão do salário” e o evento I: “o funcionário sai da empresa em razão da impossibilidade de
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
crescimento profissional”. Nessas condições, a probabilidade de um funcionário sair da empresa devido à insatisfação com o salário ou à insatisfação com sua impossibilidade de crescimento profissional é de P(SI P(S +P(I ²P(SI 0,+0,2²0,0 0, Esse resultado pode ser generalizado. Para A1, A2, A eventos de ƺ, WHPVHTXH P(A1A2A P(A1 +P(A2 +P(A ²P(A1A2 ²P(A1A ²P(A2A +P(A1A2A
Para nHYHQWRVWHPVH
A prova desse resultado é baseada no SULQFtSLRGDLQGXomRÀQLWDHQmRVHUi IHLWDDTXL
4 Probabilidade conjunta e dependência (PPXLWDVVLWXDo}HVSUHFLVDPRVDQDOLVDUDSUREDELOLGDGHGHRFRUUrQFLD VLPXOWkQHDGHGRLVRXPDLVHYHQWRVGHXPHVSDoRDPRVWUDO1DVHomRDQWHULRU HVVDQHFHVVLGDGHIRLUHTXHULGDQR([HPSOR(QWHQGHUHPRVFRPRprobabilidade FRQMXQWD de dois ou mais eventos a probabilidade da interseção deles. Isto é, se A1, A2, ..., An são eventos de ƺ, então P(A1, A2, ..., An : P(A1A2An é a probabilidade conjunta deles.
Série Novos Autores da Educação Profissional e Tecnológica
149
150
Capítulo V - Noções de probabilidade
1RFDVRSDUWLFXODUGR([HPSORWtQKDPRVDLQIRUPDomRGDSUREDELOLGDGH conjunta dos eventos S e ILVWRpIRLGDGRTXHP(SI 0,0RTXHSRVVLELOLWRX DUHVROXomRGRSUREOHPD$TXHVWmRTXHVXUJHpFRPRSURFHGHUQRFDVRHPTXH HVVDLQIRUPDomRQmRHVWLYHUH[SOtFLWD" 3DUDVLPSOLÀFDUDGLVFXVVmRYDPRVWUDEDOKDUFRPGRLVHYHQWRVGLJDPRV A e B-iVDEHPRVRTXHDFRQWHFHTXDQGRRVHYHQWRVA e B são mutuamente H[FOXVLYRVLVWRpTXDQGRAB = Ø. Nesse caso, P(A, B P(AB 0. 7RGDYLD SDUD UHVSRQGHU D HVVD TXHVWmR PDLV JHUDOPHQWH SUHFLVDUHPRV iniciar uma discussão sobre dependência de eventos.
4.1 Dependência Introduzimos esta discussão a partir de um exemplo simples, apresentado QRLQtFLRGHVWHFDStWXORR([HPSOR Exemplo 5.10. Suponhamos que, no Exemplo 5.3, a moeda lançada seja honesta. Então, cada vetor do espaço amostral ƺ0 é equiprovável, isto é, ocorre com a mesma probabilidade.8 No caso, como #(ƺ0 , temos que 1 P({(k, k ` P({(k, c ` P({(c, k ` P({(c, c ` 4 /RJR 1 P(A P(B 2 Como o evento A B {FDUDQDVGXDVHQWUDGDV` {(k, k `, YHPRVTXHDSUREDELOLGDGHFRQMXQWDGRVYHWRUHVA e B é dada por
$TXLDPHGLGDGHSUREDELOLGDGHQDWXUDOpDGHÀQLGDQR([HPSOR
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
$QDOLVDQGRHVVHH[HPSORSRGHPRVQRWDUTXHDRFRUUrQFLDRXQmRGHFDUDQD SULPHLUDHQWUDGDGRYHWRUQmRLQWHUIHUHQDRFRUUrQFLDGHFDUDQDVHJXQGDHQWUDGDGR YHWRULVWRpDRFRUUrQFLDRXQmRGRHYHQWRAQmRLQWHUIHUHQDRFRUUrQFLDGRHYHQWR B6HPSUHTXHLVVRDFRQWHFHGL]HPRVTXHRVHYHQWRVA e B são independentes. 0DWHPDWLFDPHQWH D LQGHSHQGrQFLD GH HYHQWRV VH FDUDFWHUL]D SHOD (TXDomR QDGHÀQLomRDEDL[R 'HÀQLomR Dois eventos A e B de um espaço amostral ƺ são ditos independentes se P(A, B P(A P(B
(5.5)
3HODGHÀQLomRYHPRVTXHGHIDWRRVHYHQWRVA e BGR([HPSORVmR independentes. 8PDREVHUYDomRLPSRUWDQWHpTXHVHA e B são mutuamente exclusivos, isto é, se A B ØQmRVLJQLÀFDTXHHOHVVHMDPLQGHSHQGHQWHV3HORFRQWUiULRD LQGHSHQGrQFLDRFRUUHUiDSHQDVFDVRXPGHVVHVHYHQWRVWHQKDSUREDELOLGDGH]HUR 4XDQGRD(TXDomRQmRRFRUUHGL]HPRVTXHRVHYHQWRVVmRdependentes. 8PDLQWHUSUHWDomRKHXUtVWLFDSDUDDVLWXDomRGHGHSHQGrQFLDHQWUHHYHQWRVpGH TXHDRFRUUrQFLDRXQmRRFRUUrQFLDGHXPLQWHUIHUHQDRFRUUrQFLDGRRXWUR &RP HVVD QRomR GH GHSHQGrQFLD ID] VHQWLGR SHQVDU QR TXDQWR D RFRUUrQFLDRXQmRGHXPHYHQWRLQWHUIHUHQDSUREDELOLGDGHGHRXWURRFRUUHU
4.2 Probabilidade condicional 1R ([HPSOR YLPRV TXH R HYHQWR A QmR LQWHUIHUH QD RFRUUrQFLD de B SRLV HOHV VmR LQGHSHQGHQWHV 2 PHVPR QmR RFRUUH TXDQGR RV HYHQWRV
Série Novos Autores da Educação Profissional e Tecnológica
151
152
Capítulo V - Noções de probabilidade
VmR GHSHQGHQWHV $ ÀP GH TXDQWLÀFDU HVVD LQWHUIHUrQFLD GHÀQLPRV R TXH chamaremos de probabilidade condicionalGDGRTXHXPHYHQWRRFRUUH 'HÀQLomR Sejam ƺ um espaço amostral e B(ƺ WDOTXHP(B !0. A probabilidade condicional de A dado BpGHÀQLGDSRU
$ÀPGHPHOKRUDUQRVVDLQWXLomRDUHVSHLWRGDSUREDELOLGDGHFRQGLFLRQDO DSUHVHQWDPRVRVHJXLQWHH[HPSOR Exemplo 5.11. Suponha que uma caixa contenha 3 moedas: 2 honestas e uma de 2 caras. Ao retirar da caixa uma moeda ao acaso e jogá-la, qual é a probabilidade de a moeda ter sido a de 2 caras, dado que o resultado final foi cara? Podemos analisar o problema como sendo um experimento composto, isto é, teremos de analisar mais de um experimento para tirar conclusões a respeito GH XP HYHQWR TXH GH DOJXPD IRUPD UHODFLRQD HVVHV H[SHULPHQWRV 1R FDVR SRGHPRVFRQVLGHUDURVVHJXLQWHVH[SHULPHQWRV ([SHULPHQWR´HVFROKDGHXPDPRHGDGDFDL[Dµ ([SHULPHQWR´ODQoDPHQWRGHXPDPRHGDGDFDL[DHREVHUYDomRGD face”. 2FRQMXQWRƺ1 {mH, mV` corresponde ao espaço amostral do Experimento HPTXHmH e mVVLJQLÀFDPUHVSHFWLYDPHQWHPRHGDKRQHVWDHPRHGDYLFLDGD 3HODVKLSyWHVHVGRSUREOHPDQDFDL[DKiXPDPRHGDYLFLDGDQRVHQWLGRGHTXH SRVVXL IDFHV H KRQHVWDV ,VVR VLJQLÀFD TXH DR HVFROKHU DOHDWRULDPHQWH XPD PRHGDHQWUHDVGLVSRQtYHLVQDFDL[DWHPRVTXHDP1({sair moeda honesta` 2/ e P1({sair moeda viciada` 1/. 3RURXWURODGRDRFRQVLGHUDUPRVR([SHULPHQWRRFRQMXQWRƺ1 {k, c` pVHXHVSDoRDPRVWUDO$SUHVHQoDGDPRHGDYLFLDGDQDFDL[DID]FRPTXHD TXDQWLGDGHGHFDUDVHFRURDVGHQWURGDFDL[DHVWHMDGHVHTXLOLEUDGDLVWRpD P2({sair coroa` 1/ e P2({sair cara` 2/.
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
2H[SHULPHQWRFRPSRVWRQHVVHFDVRVHULD ([SHULPHQWR FRPSRVWR ´HVFROKD H ODQoDPHQWR GH XPD PRHGD H REVHUYDomRGRUHVXOWDGRHPGLPHQV}HVTXDQWRDRWLSRGHPRHGD HTXDQWRDVXDIDFHµ Podemos pensar no conjunto ~
ƺ {(mH, k ,(mH, c ,(mV, k ,(mV, c ` FRPR R HVSDoR DPRVWUDO SDUD R ([SHULPHQWR FRPSRVWR VREUH R TXDO HVWi GHÀQLGDXPDPHGLGDGHSUREDELOLGDGH . ~
Consideraremos os eventos A e B contidos em ƺWDLVTXHA {PRHGDpYLFLDGD` ~ e B {VDLUFDUD`,e a partição de ƺ pelo evento B, isto é, ~
~
~
ƺ ƺBƺB , C
HPTXHRVFRQMXQWRV ~
ƺB {(w,VDLUFDUD wƺ1` {(mH, k ,(mV, k ` e ~
ƺB {(w,QmRVDLUFDUD wƺ1` {(mH, c ,(mV, c ` C
Se considerarmos o evento ~
AB {(PRHGDYLFLDGD,VDLUFDUD ` {(mV, k ` então podemos calcular a probabilidade condicional P(A/B de a moeda ser YLFLDGDFRQVLGHUDQGRDLQIRUPDomRGHTXHVDLXFDUDDVVLP
Por outro lado, fazendo algumas manipulações algébricas, obtemos
Série Novos Autores da Educação Profissional e Tecnológica
153
154
Capítulo V - Noções de probabilidade
~
~
HPTXHPpXPDPHGLGDGHSUREDELOLGDGHFRQMXQWDGHÀQLGDVREUHƺ. 2 TXH D (TXDomR VXJHUH p TXH D SUREDELOLGDGH FRQGLFLRQDO GH XP ~ evento AGDGRXPHYHQWRÀ[RB, sendo A, B ƺpLJXDOjUD]mRHQWUHDPHGLGD ~ ~ de probabilidade PDVVRFLDGDjƺ avaliada nos eventos A B e B, respectivamente. (VVDLQWHUSUHWDomRVHUYHGHPRWLYDomRSDUDD'HÀQLomR 8P IDWR LPSRUWDQWH p TXH D SUREDELOLGDGH FRQGLFLRQDO P(/B é uma PHGLGDGHSUREDELOLGDGH(VVHIDWRSRGHVHUIDFLOPHQWHYHULÀFDGRHVHUiGHL[DGR como exercício. Assim, todas as propriedades operatórias envolvendo medidas GHSUREDELOLGDGHQDWXUDOPHQWHVHUmRYiOLGDVSDUDDSUREDELOLGDGHFRQGLFLRQDO
4.3 Teorema de Bayes 1HVWD VXEVHomR DSUHVHQWDUHPRV XP WHRUHPD TXH SRGH VHU YLVWR FRPR uma generalização do conceito de probabilidade condicional. Para isso, considere um espaço amostral ƺ, uma partição P = {A1,A2,,An` de ƺ e um evento B TXDOTXHUGHƺ. 7HRUHPD (Teorema de Bayes)
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
Demonstração:3HOR7HRUHPDWHPRVTXH
'DGHÀQLomRGHSUREDELOLGDGHFRQGLFLRQDOWHPRVTXH P(BAj P(B/Aj P(Aj , j 1,2,,n
$VVLPVHVXEVWLWXLUPRVD(TXDomRQD(TXDomRREWHPRVSRUXPODGR TXH
3RURXWURODGRWDPEpPSHODGHÀQLomRGHSUREDELOLGDGHFRQGLFLRQDO
$~OWLPDLJXDOGDGHQD(TXDomRIRLREWLGDXWLOL]DQGRVHD(TXDomR
A fórmula de Bayes p ~WLO TXDQGR FRQKHFHPRV DV SUREDELOLGDGHV GRV eventos da partição e a probabilidade condicional de B, dado Aj, mas não conhecemos diretamente a probabilidade de B. &RPRDSOLFDomRGR7HRUHPDYDPRVUHVROYHUR([HPSORUHVROYLGR na subseção anterior. Exemplo 5.12. Considere a situação do Exemplo 5.11 e os eventos listados ~ abaixo, pertencentes ao espaço amostral ƺ
e
A1 {DPRHGDUHWLUDGDpKRQHVWD`, A2 {DPRHGDUHWLUDGDpDGHGXDVFDUDV` B {RUHVXOWDGRÀQDOpFDUD`
$ OLWHUDWXUD jV YH]HV VH UHIHUH j IyUPXOD GH %D\HV FRPR VHQGR D ´IyUPXOD GH SUREDELOLGDGHV a posteriori”, P(Aj/B , e as probabilidades dos eventos da partição, P(Aj , são chamadas de probabilidades a priori.
Série Novos Autores da Educação Profissional e Tecnológica
155
156
Capítulo V - Noções de probabilidade
Aplicando a fórmula de Bayes, teremos
Exercícios 'HWHUPLQHDSUREDELOLGDGHGHFDGDHYHQWR a) um número par aparece no lançamento de um dado não viciado. E XPUHLDSDUHFHDRH[WUDLUVHXPDFDUWDGHXPEDUDOKR c) pelo menos uma cara aparece no lançamento de 3 moedas. d) pelo menos uma cara aparece no lançamneto de n moedas. e) duas copas aparecem ao se retirarem duas cartas de um baralho. f) uma carta de copas e uma de ouros aparecem ao se extraírem duas cartas de um baralho. 8PSRQWRpHVFROKLGRDRDFDVRQRLQWHUYDOR>@$SUREDELOLGDGHGH TXHRSRQWRHVFROKLGRHVWHMDHQWUHHpGH a)
.
b)
.
c)
.
d)
.
e)
.
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
$SUREDELOLGDGHGHXPDWLUDGRUDFHUWDUXPDOYRp6HHOHDWLUDU YH]HVDSUREDELOLGDGHGHHOHDFHUWDUWLURVpGH a)
.
b)
.
c)
.
d)
.
e)
.
,)* 1RODQoDPHQWRGHGRLVGDGRVSHUIHLWRVTXDOpDSUREDELOLGDGHGH RSURGXWRGRVGRLVQ~PHURVREWLGRVVHUSDU" a)
.
b)
.
c)
.
d)
.
e)
.
1XP ORWH GH SHoDV Ki GHIHLWXRVDV 6H SHoDV VmR UHWLUDGDV DOHDWRULDPHQWHGHWHUPLQH a) a probabilidade de ambas serem defeituosas. b) a probabilidade de ambas não serem defeituosas. c) a probabilidade de, pelo menos, uma ser defeituosa.
Série Novos Autores da Educação Profissional e Tecnológica
157
158
Capítulo V - Noções de probabilidade
8PDXUQDFRQWpPERODVYHUGHVHYHUPHOKDV6HGHODVVmRUHWLUDGDV DRDFDVRGHWHUPLQH a) a probabilidade de todas serem verdes. b) a probabilidade de uma ser vermelha. c) a probabilidade de, pelo menos, uma ser verde. 7UrV PiTXLQDV $ % H & SURGX]HP UHVSHFWLYDPHQWH H GR WRWDO GH SHoDV GH XPD IiEULFD $V SRUFHQWDJHQV GH SHoDV GHIHLWXRVDVQDVUHVSHFWLYDVPiTXLQDVVmRH8PDSHoDp VRUWHDGDDRDFDVRHYHULÀFDVHTXHpGHIHLWXRVD4XDODSUREDELOLGDGH GHTXHDSHoDWHQKDYLQGRGDPiTXLQD%" ,)* 6DEHQGRTXH DÀUPDUTXH
,
e
, podemos
a) P(B/A . b) P(A B . c) P(A/B . d) P(A B . e) P(A B . ,)* 1XPD EROVD Ki PRHGDV GH 5 H PRHGDV GH 5 $SUREDELOLGDGHGHDRUHWLUDUPRVGDEROVDPRHGDVDOHDWRULDPHQWH REWHUPRV5pGH a)
.
b)
.
c)
.
d)
.
e)
.
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
,)* 8PDFRPSDQKLDGHVHJXURVYHQGHXDSyOLFHVDSHVVRDVWRGDV da mesma idade e nas mesmas condições de saúde. A companhia VDEHDWUDYpVGHHVWDWtVWLFDVDWXDULDLVTXHDSUREDELOLGDGHGHFDGDXPD GHVVDVSHVVRDVHVWDUYLYDGDtDDQRVpGH4XDOpDSUREDELOLGDGH GHSHORPHQRVGHVVDVSHVVRDVHVWDUHPYLYDVGDTXLDDQRV" a)
.
b)
.
c)
.
d)
.
e)
.
,)* 'H DFRUGR FRP FHUWD WiEXD GH PRUWDOLGDGH D SUREDELOLGDGH GH -RVp H 0DQXHO HVWDUHP YLYRV GDTXL D DQRV p GH H respectivamente. A probabilidade de um deles estar vivo e o outro HVWDUPRUWRGDTXLDDQRVpGH D E F G H ,)* 2V VHJXLQWHV JUXSRV GH SHVVRDV HVWmR QXPD VDOD KRPHQV PDLRUHVGHDQRVKRPHQVFRPPHQRVGHDQRVPXOKHUHV PDLRUHV GH DQRV H PXOKHUHV PHQRUHV GH DQRV GH LGDGH 8PDSHVVRDpHVFROKLGDDRDFDVR'HÀQHPVHRVVHJXLQWHVHYHQWRV A {DSHVVRDpPDLRUGH21DQRV`
B {DSHVVRDpPHQRUGH21DQRV`
C {DSHVVRDpKRPHP`
H
D {DSHVVRDpPXOKHU`
Série Novos Autores da Educação Profissional e Tecnológica
159
160
Capítulo V - Noções de probabilidade
&RPEDVHQHVVDVLQIRUPDo}HVPDUTXHDDOWHUQDWLYDFRUUHWD a) P(B D
.
b) P(Ac Bc
.
c) P(A C
.
d) P(B C
.
e) P(B D
.
,)* 2VDOJDULVPRVHVmRHVFULWRVHPFDUW}HVGLIHUHQWHV Esses cartões são escolhidos (sem reposição) aleatoriamente, e os DOJDULVPRV TXH YmR DSDUHFHQGR VmR HVFULWRV GD HVTXHUGD SDUD D direita, formando um número de 5 algarismos. Assim, a)
é a probabilidade de o número formado ser par.
b)
é a probabilidade de o número formado ser ímpar.
c)
é a probabilidade de o número formado ser ímpar, se considerarmos a escolha com reposição. é a probabilidade de o número formado ser divisível por 5.
d)
é a probabilidade de o número formado ser par, se considerarmos a escolha com reposição.
e)
,)* 8P SDU GH GDGRV p DWLUDGR (QFRQWUH D SUREDELOLGDGH GH D VRPDVHUPDLRURXLJXDODVHXPDSDUHFHQRSULPHLURGDGR a)
.
b)
.
c)
.
d)
.
e)
.
Série Novos Autores da Educação Profissional e Tecnológica
Probabilidade e Estatística: um curso introdutório
,)* 6HMDP A e B eventos de um espaço amostral ƺ. Podemos DÀUPDUTXH a) b) c) d) e)
P(A !1, se A B. Se A B, então P(B dP(A Se A B, então P(A dP(B . P(ƺ 0 e P(Ø 1 ƺ (A Ac ²(A Ac .
,)* 1DXUQDu1KiERODVSUHWDVDPDUHODVHEUDQFDV1DXUQD u2KiXPDERODSUHWDDPDUHODVHEUDQFDV(VFROKHVHXPDXUQD DRDFDVRHGHODH[WUDLVHXPDERODDRDFDVR$VVLP a) se a bola for preta, então urna u2.
é a probabilidade de ela ter vindo da
b) se a bola for amarela, então da urna u2.
é a probabilidade de ela ter vindo
c) se a bola for branca, então da urna u1.
é a probabilidade de ela ter vindo
d) se a bola for branca, então da urna u1.
é a probabilidade de ela ter vindo
e) se a bola for preta, então urna u1.
é a probabilidade de ela ter vindo da
,)% 8PDSRUFDLUiSDULUOHLW}HV6XSRQKDTXHWRGRVQDVFHUmR YLYRV&RQVLGHUDQGRTXHH[LVWHGHFKDQFHGHFDGDOHLWmRQDVFHU PDFKRHQWmRDSUREDELOLGDGHGHTXHQDVoDPH[DWDPHQWHPDFKRV pGH a) 210(0, 10 b)1(0, 10 c) 210(0, d) 210(0, e) 1²1(0,
Série Novos Autores da Educação Profissional e Tecnológica
161
REFERÊNCIAS BIBLIOGRÁFICAS
Referências bibliográficas
-$0(6%Probabilidade:XPFXUVRGHQtYHOLQWHUPHGLiULRHG5LRGH-DQHLUR ,PSD 0$*$/+®(601/,0$$&3Noções de probabilidade e estatística. 6mR3DXOR(GXVS /,0$(/Curso de análise.9HG5LRGH-DQHLUR$VVRFLDomR,QVWLWXWRGH 0DWHPiWLFD3XUDH$SOLFDGD %($5=27,(%8(12),/+2-66Introdução à inferência estatística. /DYUDV0* 8ÁD)DHSH 081,= - $ %8(12 ),/+2 - 6 6 9(,*$ 5 ' Técnicas de amostragem. /DYUDV0*8ÁD)DHSH /,0$3&$%5(8$5Técnicas de amostragem./DYUDV0*8ÁD)DHSH
166
Referências bibliográficas
)216(&$ - 6 0$57,16 * $ Curso de estatística. HG 6mR 3DXOR $WODV 2 +$*$1$Bayesian inference..HQGDOO VDGYDQFHGWKHRU\RIVWDWLVWLFV/RQGRQ &DPEULGJH8QLYHUVLW\3UHVV
Série Novos Autores da Educação Profissional e Tecnológica