Distribuição Amostral para Médias  

Já vimos anteriormente que se tomamos uma amostra X1, X2, ...,Xn de uma população N(m , s 2), sabemos que a média amostral  tem média m e variância s 2/n.

Se nós estivermos trabalhando com uma população que tem uma distribuição de probabilidade desconhecida, a média amostral continuará tendo distribuição aproximadamente normal com média m e variância s 2/n, se a mostra for grande. Este é uma dos mais úteis teoremas em estatística, chamada Teorema do Limite Central.
 
Teorema 6.1 

Se X1, X2, ...,Xn é uma amostra de tamanho n, tomada de uma população com média m e variância s 2, e 
se  é a média amostral, então a forma limite da distribuição de 

 

A forma da distribuição depende do tamanho da amostra (n). 
 

 

Exemplo

1. Uma fábrica produz resistores que têm média 100W e desvio padrão 10W . Considere a distribuição da resistência como normal. Encontre a probabilidade que uma amostra de tamanho 25 tenha média menor que 95W .

P ( < 95) = P (Z < -2.5) = 0.0062

 
Definição
O erro padrão de uma estatística é o desvio padrão da distribuição amostral. Se o desvio padrão envolve algum parâmetro desconhecido, cujo valor pode ser estimado, a substituição desse valor produz o desvio padrão estimado. 
 

O desvio padrão dá a idéia de precisão de estimação. Por exemplo, se a média amostral é usada como estimador pontual da média da população, o desvio padrão de  mede o quão preciso ele estima m .

Exemplo

Suponha que estamos testando um novo método para medir condutividade térmica de um determinado metal. Usando uma temperatura de 100F e 500W de potência, obtivemos as seguintes medidas:

41.60; 41.48; 42.34; 41.95; 41.86; 42.18; 41.72; 42.26; 41.81; 42.04

Um estimador pontual da condutividade térmica é a média amostral =41.924

O desvio padrão da média amostral é s /n, no entanto s é desconhecido logo, usaremos como estimador o desvio padrão amostral S = 0.284

Observe que o desvio padrão está em torno de 0.2% da média amostral, isto indica que temos um estimador relativamente preciso para a estimação da condutividade térmica.

Suponha, agora, que nós temos duas populações. Seja m1 a média e a variância da primeira população e m2 a média e a variância da segunda população. Suponha que ambas as populações são normalmente distribuídas. Usando que combinações lineares de Normais fornecem distribuições também normais, podemos dizer que

Se as populações não são normalmente distribuídas, mas n > 30, podemos usar o teorema do limite central (TLC) e dizer que  tem distribuição aproximadamente normal. Resumindo teremos que

é aproximadamente uma normal padrão, se podemos aplicar as condições do TLC. Se as duas populações são normais então Z é, exatamente, uma N(0,1).