Amostragem Aleatória


 
Definição 
População é a coleção de todos os elementos cujas características desejamos conhecer. Os elementos (ou "indivíduos") na população não são necessariamente pessoas !

Em qualquer problema, a população pode ser pequena, grande mas finita ou infinita. O número de observações em uma população é chamado tamanho da população. Por exemplo os moradores de Ipanema ou o número de garrafas produzidas por dia em uma cervejaria são exemplos de populações finitas.

Na maioria dos problemas é impossível ou impraticável observar toda a população. Portanto nós dependemos de um subconjunto de observações para auxiliar na tomada de decisões sobre a população.
 
Definição 
Amostra é um subconjunto de observações de uma população.

Para que a inferência seja válida, a amostra precisa ser representativa . Por isso, estamos sempre tentando selecionar as observações que são mais convenientes como amostra. Estes procedimentos podem, frequentemente, introduzir tendências (BIAS) na amostra e como resultado o parâmetro de interesse será subestimado (ou superestimado) para tal amostra. No entanto, o comportamento do julgamento de escolha da amostra não pode ser estatisticamente descrito. Para prevenir tais dificuldades, é desejável que a escolha da amostra seja resultado de algum mecanismo aleatório. Consequentemente, a seleção de uma amostra é um experimento aleatório e cada observação na amostra é o valor observado da variável aleatória.

Para definir uma amostra aleatória, seja X um v.a. que representa o resultado da seleção de uma observação da população. Seja f(x) a função densidade de probabilidade de X. Suponha que cada observação na amostra é independente e foi obtida nas mesmas condições que as outras.

 
Definição
As v.a’s X1, X2, X3, ....,Xn são uma amostra aleatória de tamanho n se
                                     a) Os Xi ‘s são variáveis aleatórias independentes 
                                     b). Cada Xi tem a mesma distribuição de probabilidade

Imagine que estamos investigando o tempo de vida efetivo de um componente usado em marca-passos, e que o componente é normalmente distribuído. Então espera-se que cada uma das observações
X1 , X2, X3, ....,Xn forme uma a.a. de n componentes, cada uma delas normalmente distribuída e independentes entre si.

O principal motivo que nos leva a tomar a.a. é tentar obter informações sobre parâmetros desconhecidos da população. Suponha, por exemplo, que nós desejamos tirar conclusões sobre a proporção de pessoas no Rio de Janeiro que preferem uma determinada marca de refrigerantes. Seja p o valor desconhecido desta proporção. É impraticável questionar cada morador do RJ para determinar o valor verdadeiro de p. Uma maneira de inferir sobre o valor de p é selecionar um a.a. (de tamanho apropriado) e usar a proporção observada  de pessoas que preferem a marca investigada.

A proporção amostral  é computada dividindo o número de indívíduos que preferem a marca pelo total da amostra. n. Portanto  é uma função dos valores de cada observação na a.a. Como várias amostras podem ser tomadas na população, o valor de  irá variar e portanto,  é uma v.a. Este tipo de v.a. é chamada estatística.
 
Definição 
Uma estatística é qualquer função das observações de uma a.a.

Como uma estatística é uma v.a., ela tem uma distribuição de probabilidade. A noção de distribuição amostral é muito importante é será visto mais tarde.

Uma aplicações mais importantes de estatística é obter estimações pontuais dos parâmetros tais como média e variância da população. Usaremos q para denotar o parâmetro de interesse. O objetivo da estimação pontual é selecionar um único número, baseado na amostra, que é o valo mais plausível de q.

Em geral, se X é uma v.a. com distribuição de probabilidade f(x), caracterizado por um parâmetro desconhecido q, e se X1 , X2, X3, ....,Xn é uma a.a. de tamanho n de X, então a estatística
 = h (X1 , X2, X3, ....,Xn) é chamada estimador pontual de q. Note que  é uma v.a. por que é uma função de v.a.’s. Temos de colhida a amostra,  toma uma valor numérico particular chamado estimador pontual.

 
Definição
Um estimador pontual de um parâmetro q da população é um valor numérico  para a estatística .

Nós estamos frequentemente interessados em estimar:

Podemos ter diversos estimadores para cada parâmetro desconhecido, por isto estaremos interessados em estimadores que possuam certas propriedades.