Sur la loi hypergéométrique

Menu



On dit qu'une variable aléatoire $X$ suit la loi hypergéométrique de paramètres $n\in\mathbb{N}^*$, $N\in\mathbb{N}^*$ et $p\in]0,1[$, avec $n\leq N$ et $Np\in\mathbb{N}$ (ces conditions paraîtront naturelles une fois vue la modélisation) lorsque : $$X(\Omega)\subseteq\lc0,n\rc\qquad\hbox{et}\qquad \forall k\in\lc0,n\rc, \quad \mathbb{P}(X=k) = \frac{\displaystyle\binom{Np}{k}\binom{Nq}{n-k}}{\displaystyle\binom{N}{n}}$$ où $q=1-p$ vérifie ausi $Nq=N-Np\in\mathbb{N}$, et avec la convention $\displaystyle\binom{j}{i}=0$ si $i\notin \lc0,j\rc$.
On le note $X\sim\mathcal{H}(N,n,p)$.

Remarque.
A prori $X(\Omega)$ n'est pas égal à $\lc0,n\rc$; ceci ne pose pas de problème, car dans la définition $\mathbb{P}(X=k)=0$ pour certaines valeurs de $k$, graĉe à la convention habituelle sur les coefficients binomiaux.
D'ailleurs, on pourrait aussi supposer que : $$X(\Omega)\subseteq \mathbb{Z} \qquad\hbox{et}\qquad \forall k\in \mathbb{Z}, \; \mathbb{P}(X=k) = \frac{\displaystyle\binom{Np}{k}\binom{Nq}{n-k}}{\displaystyle\binom{N}{n}}$$ Nous préciserons dans la modélisation $X(\Omega)$, mais en pratique cela n'a pas d'intérêt.



1. Formule de Van der Monde.

On peut en déduire la formule de Van der Monde, en posant $N=a+b$ et $p=\displaystyle \frac{a}{a+b}$ avec $(a,b)\in\big(\mathbb{N}^*\big)^2$.
En effet si $X\sim\mathcal{H}\left(a+b,n,\displaystyle\frac{a}{a+b}\right)$, la propriété $\displaystyle \sum_{k=0}^n\mathbb{P}(X=k)=1$ donne $\displaystyle \binom{n}{a+b}= \sum_{k=0}^n\binom{a}{k}\binom{b}{n-k}$.




2. Modélisation I.

On considère une urne de $N\in\mathbb{N}^*$ boules dont $N_1\in\mathbb{N}^*$ blanches et $N_2\in\mathbb{N}^*$ noires, avec $N=N_1+N_2$.
On effectue un tirage simultané de $n$ boules et on note $X$ le nombre de boules blanches obtenues.
Alors $X\sim\mathcal{H}(N,n,p)$ où $p=\displaystyle \frac{N_1}{N}$ est la proportion de boules blanches dans l'urne.

Remarque.
Les conditions $n\leq N$ (on ne peut pas tirer simultanément, plus de boules qu'il n'y en a dans l'urne) et $Np\in\mathbb{N}$ ($p$ est la proportion d'une des deux couleurs dans l'urne) paraissent ici naturelles !
On est aussi en mesure de déterminer précisément $X(\Omega)$.
Au minimum, on ne tire aucune boule blanche, mais ceci n'est possible que si on a obtenu $n$ noires.
Comme celles-ci sont au nombre de $N_2$, il n'est en fait pas possible d'en tirer $n$ lorssque $n>N_2$.
Dans ce cas on obtient au minimum $n-N_2$ blanches.
Au maximum, on ne tire que des boules blanches, mais comme celles-ci sont au nombre de $N_1$, ce ne sera pas possible si $n>N_1$.
Dans ce cas on obtient au maximum $N_1$ blanches.
Ainsi $X(\Omega)=\lc\min(0,n-N_2),\max(n,N_1)\rc$ (un peu compliqué à utiliser en pratique ! ).

PREUVE [ afficher/masquer ]



3. Modélisation II.

On reprend la même urne (et les mêmes notations).
On tire encore une fois $n$ boules mais cette fois les tirages se font une par une et sans remise.
On note $X$ le nombre de boules blanches obtenues.
Alors $X\sim\mathcal{H}(N,n,p)$ où $p=\displaystyle \frac{N_1}{N}$ est la proportion de boules blanches dans l'urne.

Remarque 1.
On vient donc de démontrer que les calculs de probabilités donnent les mêmes résultats, que les tirages soient faits simultanément ou sans remise, ce qui est remarquable.
Mais attention, ceci est faux pour les calculs de dénombrement !


Remarque 2.
Et si les tirages sont effectuées avec remise ? La réponse est bien connue : $X\sim\mathcal{B}(n,p)$.

PREUVE [ afficher/masquer ]



4. Espérance.

On a $\mathbb{E}(X)=np$.

PREUVE [ afficher/masquer ]



5. Variance.

On a $V(X)=\displaystyle np(1-p)\frac{N-n}{n-1}$.

PREUVE [ afficher/masquer ]



6. Fonction génératrice.

Elle est beaucoup trop compliquée ! (liée à la fonction hypergéométrique, voir Foata-Fuchs Calcul des probabilités).




7. Approximation d'une loi hypergéométrique par une loi binomiale.

Pour tout $n\in\mathbb{N}$, on se donne $X_N$ de loi $\mathcal{H}(N,n,p)$.
Alors : $\forall k\in[\![0;n]\!]$, $\displaystyle\lim_{N\to+\infty}\mathbb{P}(X_N=k)=\binom{n}{k}p^k(1-p)^{n-k}$.
Autrement dit : $X_N\overset{(\mathcal{L})}{\underset{N\to+\infty}{\longrightarrow}}\mathcal{B}(n,p)$.
Intuitivement cela signifie que, lorsque le nombre de boules dans l'urne est très grand, on approcher des tirages sans remise par des tirages avec remise (qui eux sont indépendants).

PREUVE [ afficher/masquer ]



8. Un lien moins connu entre la loi binomiale et la loi hypergéométrique.

Si $X\sim\mathcal{B}(n_1,p)$, $Y\sim\mathcal{B}(n_2,p)$ et $X$ est indépendante de $Y$, alors la loi de $X$ sachant $X+Y=k$ est la loi $\displaystyle\mathcal{H}\left(n_1+n_2,k,\frac{n_1}{n_1+n_2}\right)$ pour tout $k\in\lc0,n_1+n_2\rc$.

PREUVE [ afficher/masquer ]



Author: Arnaud Bégyn

Created: 2024-08-14 mer. 23:49

Validate