|
Em qualquer problema, a população pode ser pequena, grande mas finita ou infinita. O número de observações em uma população é chamado tamanho da população. Por exemplo os moradores de Ipanema ou o número de garrafas produzidas por dia em uma cervejaria são exemplos de populações finitas.
Na maioria dos problemas
é impossível ou impraticável observar toda a população.
Portanto nós dependemos de um subconjunto de observações
para auxiliar na tomada de decisões sobre a população.
|
Para que a inferência seja válida, a amostra precisa ser representativa . Por isso, estamos sempre tentando selecionar as observações que são mais convenientes como amostra. Estes procedimentos podem, frequentemente, introduzir tendências (BIAS) na amostra e como resultado o parâmetro de interesse será subestimado (ou superestimado) para tal amostra. No entanto, o comportamento do julgamento de escolha da amostra não pode ser estatisticamente descrito. Para prevenir tais dificuldades, é desejável que a escolha da amostra seja resultado de algum mecanismo aleatório. Consequentemente, a seleção de uma amostra é um experimento aleatório e cada observação na amostra é o valor observado da variável aleatória.
Para definir uma amostra aleatória, seja X um v.a. que representa o resultado da seleção de uma observação da população. Seja f(x) a função densidade de probabilidade de X. Suponha que cada observação na amostra é independente e foi obtida nas mesmas condições que as outras.
b). Cada Xi tem a mesma distribuição de probabilidade |
Imagine que estamos
investigando o tempo de vida efetivo de um componente usado em marca-passos,
e que o componente é normalmente distribuído. Então
espera-se que cada uma das observações
X1
, X2,
X3,
....,Xn
forme uma a.a. de n componentes, cada
uma delas normalmente distribuída e independentes entre si.
O principal motivo
que nos leva a tomar a.a. é tentar obter informações
sobre parâmetros desconhecidos da população. Suponha,
por exemplo, que nós desejamos tirar conclusões sobre a proporção
de pessoas no Rio de Janeiro que preferem uma determinada marca de refrigerantes.
Seja p o valor desconhecido desta proporção. É
impraticável questionar cada morador do RJ para determinar o valor
verdadeiro de p. Uma maneira de inferir sobre o valor de p
é selecionar um a.a. (de tamanho apropriado) e usar a proporção
observada
de pessoas que preferem a marca investigada.
A proporção
amostral
é computada dividindo o número de indívíduos
que preferem a marca pelo total da amostra. n. Portanto
é uma função dos valores de cada observação
na a.a. Como várias amostras podem ser tomadas na população,
o valor de
irá variar e portanto,
é uma v.a. Este tipo de v.a. é chamada estatística.
|
Como uma estatística é uma v.a., ela tem uma distribuição de probabilidade. A noção de distribuição amostral é muito importante é será visto mais tarde.
Uma aplicações mais importantes de estatística é obter estimações pontuais dos parâmetros tais como média e variância da população. Usaremos q para denotar o parâmetro de interesse. O objetivo da estimação pontual é selecionar um único número, baseado na amostra, que é o valo mais plausível de q.
Em geral, se X é
uma v.a. com distribuição de probabilidade f(x), caracterizado
por um parâmetro desconhecido q,
e se X1
, X2,
X3,
....,Xn
é uma
a.a. de tamanho n de X, então a estatística
=
h (X1 ,
X2,
X3,
....,Xn)
é chamada estimador pontual de q.
Note que
é uma
v.a. por que é uma função de v.a.’s. Temos de colhida
a amostra,
toma uma valor numérico particular chamado estimador pontual.
|
Nós estamos frequentemente interessados em estimar: