Densidade Hipergeométrica

A densidade Hipergeométrica está relacionada à amostragem sem reposição. Seja N o tamanho de uma população onde existem r objetos do tipo A ("sucessos") e N - r objetos do tipo B ("falhas"). Toma-se uma amostra sem reposição de tamanho n, e seja X a variável aleatória que indica o número de objetos do tipo A na amostra. Então X tem densidade Hipergeométrica com parâmetros N, n e r, e a função de probabilidade de X é :

Os valores possíveis de X obedecem às seguintes restrições :

0 £ X £ n ( X £ tamanho da amostra )

X £ Np ( X £ número total de indivíduos do tipo A)

nX £ N(1-p) (número de indivíduos do tipo B na amostra £ número de tipo B na população)

Seja S o conjunto para o qual a densidade Hipergeométrica está definida. Então :

S = {X : max(0, n-N(1-p)) < X < min(n, Np)}
 

Média e Variância da Hipergeométrica

Se X ~ Hiper(N, n, r) então :

Note que, se N >> n, o valor esperado de X coincide com o valor esperado da densidade Binomial com parâmetros n e p = r/N e também a variância é aproximadamente a mesma que a da densidade Binomial, pois o termo (N - n)/(N - 1) é aproximadamente igual a 1.

Quando o tamanho da população cresce muito, a distribuição Hipergeométrica tende à distribuição Binomial. Ou seja, se N  ¥ , então: Hiper( N,n,r )  Bin( n,p = r/N )

Quando falamos de amostragem sem reposição (distribuição hipergeométrica), a probabilidade de seleção de um objeto de certo tipo é afetada pelo que ocorreu antes, ou seja, pelo tipo dos objetos que já foram selecionados. Existe um outro tipo de amostra, com reposição, onde as probabilidades a cada seleção se mantém inalteradas. Este tipo de amostra equivale a selecionar um objeto e jogá-lo de volta no conjunto original, apenas registrando qual o tipo de objeto que foi selecionado. O modelo probabilístico relacionado às amostras com reposição é o modelo Binomial.

Assim, se o tamanho da população é infinito (ou muito grande em relação ao tamanho da amostra), não faz diferença se a amostra é tomada com ou sem substituição, pois a probabilidade de "tirar" o mesmo indivíduo duas vezes tende a zero. Esta aproximação da Hipergeométrica pela Binomial quando o tamanho da população cresce é muito importante, por que a Hipergeométrica é difícil de lidar.

Exemplos