Já vimos anteriormente
que se tomamos uma amostra X1,
X2,
...,Xn
de uma população N(m
, s
2), sabemos que a média amostral
tem média m
e variância s
2/n.
Se nós estivermos trabalhando
com uma população que tem uma distribuição
de probabilidade desconhecida, a média amostral continuará
tendo distribuição aproximadamente normal com média
m
e variância s
2/n,
se a mostra for grande. Este é uma dos mais úteis teoremas
em estatística, chamada Teorema do Limite Central.
Se X1,
X2,
...,Xn
é uma amostra de tamanho n, tomada de uma população
com média m
e variância s
2,
e
A forma da distribuição
depende do tamanho da amostra (n).
|
Exemplo
1. Uma fábrica produz resistores que têm média 100W e desvio padrão 10W . Considere a distribuição da resistência como normal. Encontre a probabilidade que uma amostra de tamanho 25 tenha média menor que 95W .
P (
< 95) = P (Z < -2.5) = 0.0062
|
O desvio padrão dá
a idéia de precisão de estimação. Por exemplo,
se a média amostral é usada como estimador pontual da média
da população, o desvio padrão de
mede o quão preciso ele estima m
.
Exemplo
Suponha que estamos testando um novo método para medir condutividade térmica de um determinado metal. Usando uma temperatura de 100F e 500W de potência, obtivemos as seguintes medidas:
41.60; 41.48; 42.34; 41.95; 41.86; 42.18; 41.72; 42.26; 41.81; 42.04
Um estimador pontual da condutividade
térmica é a média amostral =41.924
O desvio padrão da média amostral é s /n, no entanto s é desconhecido logo, usaremos como estimador o desvio padrão amostral S = 0.284
Observe que o desvio padrão está em torno de 0.2% da média amostral, isto indica que temos um estimador relativamente preciso para a estimação da condutividade térmica.
Suponha, agora, que nós
temos duas populações. Seja m1
e a média
e a variância da primeira população e m2
e
a média
e a variância da segunda população. Suponha que ambas
as populações são normalmente distribuídas.
Usando que combinações lineares de Normais fornecem distribuições
também normais, podemos dizer que
Se as populações
não são normalmente distribuídas, mas n > 30, podemos
usar o teorema do limite central (TLC) e dizer que
tem distribuição aproximadamente normal. Resumindo teremos
que
é aproximadamente uma
normal padrão, se podemos aplicar as condições do
TLC. Se as duas populações são normais então
Z é, exatamente, uma N(0,1).