\documentclass[12pt] {article} \usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage{amsmath,amssymb,graphicx,multicol,mathrsfs, fancyhdr,enumerate,fourier,eurosym,alterqcm,enumerate,tabularx,variations,numprint}
\usepackage[dvips]{color}
\usepackage{bclogo}
\usepackage{pst-plot,pst-tree,pstricks,pst-node,pstricks-add,pst-math,pst-xkey,pst-eucl}
\usepackage[francais]{babel}
\usepackage[colorlinks=true,pdfstartview=FitV,linkcolor=blue,citecolor=blue,urlcolor=blue]{hyperref}
\everymath{\displaystyle}
\textwidth 19cm \textheight 24cm \hoffset
-1,4cm \voffset -3.7cm \oddsidemargin 0pt
\renewcommand{\thesubsection}{\textcolor{red}{\Roman{subsection}}}
\renewcommand{\thesubsubsection}{\textcolor{blue}{\Roman{subsection}}.\textcolor{blue}{\arabic{subsubsection}}}
\pagestyle{fancy}
% pour le pied de page central
\cfoot{Page \thepage/\pageref{fin}}
\title{\textbf{\textcolor{red}{Fluctuation et estimation}}}
\date{}
\author{}
\begin{document}
\maketitle
\tableofcontents
\bigskip
\subsection{\textcolor{red}{Notion d'intervalles de fluctuations et d'intervalles de confiance (rappels de seconde)}}
\subsubsection{\textcolor{blue}{Intervalles de fluctuation vus en seconde}}
Imaginons que chaque élève d'une classe lance trente fois une pièce de monnaie, qu'il regarde les résultats Pile ou Fac et calcule la fréquence d'apparition du résultats \og{}Pile\fg.
\noindent Les résultats risquent d'être différents d'un élève à l'autre
\noindent C'est ce qu'on appelle fluctuation d'échantillonnage.
Pour dix échantillons, on pourrait par exemple obtenir :
\begin{center}
\begin{tabularx}{\linewidth}{|l|*{11}{>{\centering \arraybackslash}X|}} \hline
Échantillon&1&21314&5&6&7&8&9&10\\
\hline
Fréquence&0.47 &0.63 &0.47 &0.53 &0.60 &0.57 &0.37 &0.53 \\
\hline
\end{tabularx}
\end{center}
\bigskip
\textbf{\textcolor{red}{Diagramme avec 10 échantillons}} :
\begin{center}
\psset{xunit=1.0cm,yunit=2.5cm,algebraic=true,dotstyle=o,dotsize=3pt 0,linewidth=0.8pt,arrowsize=3pt 2,arrowinset=0.25}
\begin{pspicture*}(-1,-0.2)(11,1)
\psaxes[labelFontSize=\scriptstyle,xAxis=true,yAxis=true,Dx=1,Dy=0.1,ticksize=-2pt 0,subticks=2]{->}(0,0)(-1,-0.2)(11,1)
\begin{scriptsize}
\psdots[dotstyle=*,linecolor=blue](1,0.47)(2,0.63)(3,0.47)(4,0.53)(5,0.60)(6,0.57)(7,0.57)(8,0.37)(9,0.53)(10,0.47)
\psline(1,0.47)(2,0.63)
\psline(2,0.63)(3,0.47)
\psline(3,0.47)(4,0.53)
\psline(4,0.53)(5,0.60)
\psline(5,0.60)(6,0.57)
\psline(6,0.57)(7,0.57)
\psline(7,0.57)(8,0.37)
\psline(8,0.37)(9,0.53)
\psline(9,0.53)(10,0.47)
\end{scriptsize}
\end{pspicture*}
\end{center}
\newpage
\textbf{\textcolor{red}{Diagramme avec 100 échantillons}} :
\begin{center}
\psset{xunit=0.1cm,yunit=5cm,algebraic=true,dotstyle=o,dotsize=3pt 0,linewidth=0.8pt,arrowsize=3pt 2,arrowinset=0.25}
\begin{pspicture*}(-10,-0.2)(101,1)
\psaxes[labelFontSize=\scriptstyle,xAxis=true,yAxis=true,Dx=10,Dy=0.1,ticksize=-2pt 0,subticks=2]{->}(0,0)(-1,-0.2)(101,1)
\begin{scriptsize}
\psdots[dotstyle=*,linecolor=blue](1,0.333333333333333)(2,0.533333333333333)(3,0.5)(4,0.3)(5,0.4)(6,0.333333333333333)(7,0.6)(8,0.5)(9,0.466666666666667)(10,0.7)(11,0.3)(12,0.566666666666667)(13,0.666666666666667)(14,0.5)(15,0.633333333333333)(16,0.633333333333333)(17,0.5)(18,0.466666666666667)(19,0.466666666666667)(20,0.466666666666667)(21,0.566666666666667)(22,0.533333333333333)(23,0.533333333333333)(24,0.333333333333333)(25,0.533333333333333)(26,0.8)(27,0.4)(28,0.466666666666667)(29,0.466666666666667)(30,0.4)(31,0.433333333333333)(32,0.4)(33,0.4)(34,0.533333333333333)(35,0.6)(36,0.566666666666667)(37,0.4)(38,0.4)(39,0.466666666666667)(40,0.566666666666667)(41,0.566666666666667)(42,0.666666666666667)(43,0.433333333333333)(44,0.633333333333333)(45,0.333333333333333)(46,0.466666666666667)(47,0.633333333333333)(48,0.566666666666667)(49,0.5)(50,0.466666666666667)(51,0.466666666666667)(52,0.466666666666667)(53,0.4)(54,0.533333333333333)(55,0.466666666666667)(56,0.466666666666667)(57,0.433333333333333)(58,0.666666666666667)(59,0.566666666666667)(60,0.633333333333333)(61,0.366666666666667)(62,0.333333333333333)(63,0.466666666666667)(64,0.466666666666667)(65,0.633333333333333)(66,0.666666666666667)(67,0.466666666666667)(68,0.433333333333333)(69,0.366666666666667)(70,0.7)(71,0.6)(72,0.433333333333333)(73,0.4)(74,0.433333333333333)(75,0.533333333333333)(76,0.466666666666667)(77,0.566666666666667)(78,0.4)(79,0.466666666666667)(80,0.533333333333333)(81,0.366666666666667)(82,0.5)(83,0.4)(84,0.466666666666667)(85,0.4)(86,0.4)(87,0.5)(88,0.533333333333333)(89,0.266666666666667)(90,0.7)(91,0.333333333333333)(92,0.633333333333333)(93,0.466666666666667)(94,0.633333333333333)(95,0.4)(96,0.466666666666667)(97,0.633333333333333)(98,0.666666666666667)(99,0.466666666666667)(100,0.533333333333333)
\psline[linecolor=red,linestyle=dashed](0,0.5)(100,0.5)
\end{scriptsize}
\end{pspicture*}
\end{center}
Les résultats sont différents mais \og{}proches\fg{} pour la plupart de 0,5 qui la proportion \textbf{\textcolor{red}{théorique}} de résultats \og{}Pile\fg{}.
\bigskip
\begin{bclogo}[couleur = yellow!30, arrondi = 0.1,logo=\bcbook]{\textcolor{red}{Définition}}
L'intervalle de fluctuation au seuil de 95\:\% d'une fréquence d'un échantillon de taille $n$ est l'intervalle I centré sur $p$ tel que la fréquence observée $f$ se trouve dans I avec une \textbf{probabilité égale à 95\:\%}.
\end{bclogo}
\bigskip
\begin{bclogo}[couleur = cyan!30, arrondi = 0.1,logo=\bcbook]{\textcolor{red}{Propriété}}
On suppose que $0,2\leqslant p\leqslant 0,8$ et que $n>25$.
\noindent L'intervalle de fluctuation au seuil de 95\:\% \textbf{\textcolor{red}{vu en Seconde}} est l'intervalle $\left[p-\dfrac{1}{\sqrt{n}}~;~p+\dfrac{1}{\sqrt{n}}\right]$
\noindent La probabilité que la fréquence observée $f$ soit dans cet intervalle est de 95\:\%.
On va voir plus loin un intervalle plus précis que celui vu en Seconde.
\end{bclogo}
\bigskip
\textbf{\textcolor{red}{Remarque}} : l'étendue de cet intervalle est $\dfrac{2}{\sqrt{n}}$, qui diminue quand $n$ augmente. Plus la taille de l'échantillon augmente, plus les fréquences observées se rapprochent de $p$.
\subsubsection{\textcolor{blue}{Prise de décision}}
Dans les conditions de la défintion et de la propriété :
\begin{enumerate}[$\bullet$]
\item On émet une hypothèse sur la proportion $p$ du caractère étudié de la population.
\item On détermine l'intervalle de fluctuation au seuil de 95\:\% de la proportion $p$ dans des échantillons de taille $n$..
\item Si la fréquence observée $f_0$ n'appartient pas à cet intervalle, on rejette l'hypothèse faite sur $p$ avec un risque d'erreur de $5\:\%$.
\item Si $f_0$ appartient à cet intervalle, on ne rejette pas l'hypothèse faite sur $p$.
\end{enumerate}
\subsubsection{\textcolor{blue}{Intervalles de confiance}}
On suppose désormais que l'on ne connaît pas la proportion réelle $p$ du caractère et l'on cherche à l'estimer.
\bigskip
\begin{bclogo}[couleur = yellow!30, arrondi = 0.1,logo=\bcbook]{\textcolor{red}{Propriété}}
On suppose que $p\in[0,2~;~0,8]$ (mais on ne connaît pas sa valeur) et que $n>25$.
\noindent Parmi tous les échantillons de taille $n$ possibles ayant comme fréquence observée $f$, 95\:\% des intervalles associés $\left[f-\dfrac{1}{\sqrt{n}}~;~f+\dfrac{1}{\sqrt{n}}\right]$ contiennent $p$.
\end{bclogo}
\bigskip
\begin{bclogo}[couleur = yellow!30, arrondi = 0.1,logo=\bcbook]{\textcolor{red}{Définition}}
L'intervalle $\left[f-\dfrac{1}{\sqrt{n}}~;~f+\dfrac{1}{\sqrt{n}}\right]$ est dit intervalle de confiance de $p$ au niveau 0,95.
(même définition en Seconde qu'en Terminale)
\end{bclogo}
\noindent \textbf{\textcolor{blue}{Exemple :}}
Le parti d’un candidat commande un sondage réalisé à partir de \numprint{1600} personnes à l’issue duquel il est donné gagnant avec 52\:\% des voix.\\
A-t-il des raisons d’être confiant ?\\
\noindent \textbf{\textcolor{blue}{Réponse :}}\\
Soit $p$ la proportion de gens votant pour lui ; il est élu si $p\geqslant 0,5$.\\
D'près l'intervalle de confiance, $p\in\left[f-\dfrac{1}{\sqrt{\numprint{1600}}}~;~f+\dfrac{1}{\sqrt{\numprint{1600}}}\right]=[0,495~;~0,545]$ au seuil de 95\%, donc il n'est pas sûr d'être élu.
\subsection{\textcolor{red}{Différence entre intervalles de fluctuation et de confiance sur un exemple de boules dans une urne.}}
On considère deux urnes $U_1$ et $U_2$ contenant chacun un grand nombre de boules, rouges ou bleues.
\bigskip
\begin{tabular}{|c|c|}
\hline
\textbf{\textcolor{red}{Intervalles de fluctuation}}&\textbf{\textcolor{red}{Intervalles de confiance}}\\
\hline
\begin{minipage}{9cm}
Dans l'urne $U_1$, on \textbf{connaît} la proportion $p$ de boules rouges.
On procède à des tirages, avec remise, de $n$ boules et on observe la fréquence d'apparition d'une boule rouge.
Cette fréquence change à chaque série des $n$ tirages. Celle-ci appartient à un \og{}intervalle de fluctuation\fg{} de centre $p$, dont l'amplitude diminue avec $n$.
On est ici dans le domaine de \textbf{l'échantillonnage} et de \textbf{l'intervalle de fluctuation}.
\end{minipage}&
\begin{minipage}{9cm}
Dans l'urne $U_2$, on \textbf{ignore} la proportion de boules rouges.
On effectue des tirages avec remise de $n$ boules ; on essaye alors d'estimer la proportion $p$ de boules rouges dans l'urne, proportion dont on n'a aucune idée \emph{a priori}.
Cette estimation se fait au moyen d'un \og{} intervalle de confiance\fg{}. Cet intervalle dépend d'un coefficient, le \og{}niveau de confiance\fg{} que l'on attribue à l'estimation.
On est ici dans le domaine de \textbf{l'estimation} et de \textbf{l'intervalle de confiance}
\end{minipage}\\
\hline
\end{tabular}
\bigskip
\textbf{\textcolor{red}{On se place désormais au niveau Terminale S (avec rappel pour la loi binomiale vue en Première)}}
\subsection{\textcolor{red}{Échantillonnage, intervalle de fluctuation asymptotique}}
\subsubsection{\textcolor{blue}{Intervalle de fluctuation pour une loi binomiale (vu en Première)}}
\bigskip
\begin{bclogo}[couleur = yellow!30, arrondi = 0.1,logo=\bcbook]{\textcolor{red}{Définition}}
Soit $X$ une variable aléatoire qui suit la loi binomiale $\mathscr{B}(n~;~p)$. On note $F=\dfrac{X}{n}$ la variable aléatoire qui correspond à la fréquence $f$ de succès.
\noindent Soit $\alpha\in]0~;~1[$.
\noindent Un intervalle de fluctuation au seuil $1-\alpha$ est le plus petit intervalle de la forme $\left[\dfrac{a}{n}~;~\dfrac{b}{n}\right]$ où $a$ et $b$ sont des entiers entre 0et $n$, tels que signifie que $P(a\leqslant X\leqslant b) \geqslant 1-\alpha$, c'est-à-dire $P\left(\dfrac{a}{n}\leqslant F\leqslant \dfrac{b}{n}\right)\geqslant 1-\alpha$.
\noindent On choisit donc $a$ comme le plus grand entier tel que $P(Xb)\leqslant \dfrac{1-\alpha}{2}$.
\end{bclogo}
\bigskip
\textbf{\textcolor{blue}{Remarque}} : on prend en général $1-\alpha=95\:\%=0,95$ donc $\alpha=0,25$.
\noindent $a$ est donc le plus grand entier tel que tel que $P(Xb)<0,025$.
\noindent On détermine alors les valeurs de $a$ et $b$ par les valeurs de $P(X\leqslant k)$ (obtenues avec la fonction BinomialFRép sur une TI).
\bigskip
\textbf{\textcolor{blue}{Exemple 1:}}
Dans une production de fruits, il y a 30\:\%de fruits abîmés. On prélève un échantillon aléatoire de 80 fruits (la population est suffisamment grande pour qu'on assimile ce tirage à un tirage avec remise).
Cherchons la valeur de $k$ tel que la probabilité que l'échantillon compte au moins $k$ fruits abîmés dépasse 0,025.
\noindent On note $X$ la variable aléatoire qui compte le nombre de fruits abîmés. $X\hookrightarrow\mathscr{B}(80~;~0,3)$.
On cherche le plus petit entier $k$ tel que $P(X\leqslant k)\leqslant 0,025$.
\noindent On trouve $k=16$.
\bigskip
\textbf{\textcolor{blue}{Exemple 2:}}
\noindent Dans une urne contenant 3 boules rouges et 7 boules blanches, on effectue 100 tirages d'une boule au hasard, avec remise.
\noindent On cherche l'intervalle de fluctuation au seuil de 95\:\% de la fréquence de boules rouges.
\noindent On note $X$ la variable aléatoire donnant le nombre de boules rouges obtenues lors des 100 tirages.
\noindent $X$ suit la loi binomiale $\mathscr{B}(100~;~0,3)$.
La fréquence est $F=\dfrac{X}{100}$.
\noindent À la calculatrice (ou avec un tableur), on obtient $a=21$ et $b=39$.
L'intervalle de fluctuation est donc $\boxed{\textcolor{red}{I=[0,21~;~0,39]}}$
\newpage
\subsubsection{I\textcolor{blue}{Intervalle de fluctuation asymptotique}}
Dans ce paragraphe, on suppose que la proportion $\mathbf{p}$ du caractère étudié est \textbf{connue}.
\begin{bclogo}[couleur = yellow!30, arrondi = 0.1,logo=\bcbook]{\textcolor{red}{Définition}}
Pour tout $\alpha$ dans $]0~;~1[$, un intervalle de fluctuation asymptotique e la vavriable aléatoire $F$ au seuil $1-\alpha$ est un intervalle déterminé à partir de p et de $n$ qui contient $F$ avec une probabilité d'autant plus proche de $1-\alpha$ que $n$ est grand.
\end{bclogo}
\bigskip
\textbf{Remarques} :
Cette définition met en lumière le fait qu'il n'existe pas un unique intervalle de fluctuation asymptotique à un seuil donné.
Quand on parlera de l'intervalle de fluctuation asymptotique à un seuil donné, i s'agira de celui étudié en Terminale.
\bigskip
%
\begin{bclogo}[couleur = cyan!30, arrondi = 0.1,logo=\bcbook]{\textcolor{red}{Propriété}}
Pour tout nombre réel $\alpha$ de $]0~;~1[$, il existe un unique réel positif $u_{\alpha}$ tel que la probabilité que la variable aléatoire fréquence $F_n$ prenne ses valeurs dans l'intervalle $I_n=\left[p-u_{\alpha}\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}~;~p+u_\alpha\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\right]$ se rapproche de plus en plus de $1-\alpha$ quand la taille de l'échantillon $n$ vient grande, ce que l'on note :
\[\lim_{n\rightarrow +\infty}P\left(F_n\in I_n\right)=1-\alpha\]
où $X_n$ est une variable aléatoire qui suit la loi binomiale $\mathscr{B}(n~;~p)$ et $F_n=\dfrac{X_n}{n}$.
\end{bclogo}
\bigskip
\textbf{\textcolor{red}{Démonstration}} :
On pose $Z_n=\dfrac{X_n-np}{\sqrt{np(1-p)}}$.
D'après le théorème de De Moivre-Laplace, pour tous nombres $a$ et $b$ avec $a\leqslant b$, on a :
\[\lim_{n\rightarrow +\infty}P\left(a\leqslant Z_n\leqslant b\right)=\int_a^b\dfrac{1}{\sqrt{2\pi}}\mathrm{e}^{-\frac{x^2}{2}\text{ d}x}.\]
Or $Z_n=\dfrac{n\left(\dfrac{X_n}{n}-p\right)}{\sqrt{n}\times \sqrt{p(1-p)}}=\dfrac{F_n-p}{\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}}$.
$a\leqslant Z_n\leqslant b\Leftrightarrow a\leqslant \dfrac{F_n-p}{\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}}\leqslant b$\\
$\Leftrightarrow a\times \dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\leqslant F_n-p\leqslant b\times \dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\Leftrightarrow p+a\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\leqslant F_n\leqslant p+b\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}$.
Par conséquent : $\lim_{n\rightarrow +\infty}P\left(p+a\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\leqslant F_n\leqslant p+b\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\right)=\int_a^b\dfrac{1}{\sqrt{2\pi}}\mathrm{e}^{-\frac{x^2}{2}}$ (E).
De plus, pour tout réel $\alpha\in]0~;~1[$, il existe un unique réel $u_{\alpha}$ tel que $\int_{u_{\alpha}}^{u_{\alpha}}\dfrac{1}{\sqrt{2\pi}}\mathrm{e}^{-\frac{x^2}{2}}=1-\alpha$.
En prenant $a=-u_{\alpha}$ et $b=u_{\alpha}$ dans l'égalité (E), la propriété s'ensuit.
%\begin{bclogo}[couleur = yellow!30, arrondi = 0.1,logo=\bcbook]{\textcolor{red}{Théorème et définition}}
%Si $X$ est une variable aléatoire suivant la loi normale centrée réduite $\mathscr{N}(0~;~1)$, on appelle $u_{\alpha}$ l'unique réel tel que $p\left(-u_{\alpha}\leqslant X\leqslant u_{\alpha}\right)=1-\alpha$.
%
%\noindent Soit $X_n$ une variable aléatoire suivant une loi binomiale $\mathscr{B}(n~;~p)$. et soit $\alpha$ un réel tel que $0<\alpha<1$.
%
%On appelle $I_{\alpha}$ l'intervalle $I_n=\left[p-u_{\alpha}\dfrac{p(1-p)}{\sqrt{n}}~;p+u_{\alpha}\dfrac{p(1-p)}{\sqrt{n}}~\right]$.\\
%Alors $\lim_{n\rightarrow +\infty}p\left(\dfrac{X_n}{n}\in I_n\right)=1-\alpha$.\\
%
%L'intervalle $I_n$ contient la fréquence $F_n=\dfrac{X_n}{n}$ avec une probabilité qui se rapproche de $1-\alpha$ lorsque $n$ augmente : on dit que c'est un intervalle de fluctuation asymptotique de $F_n$ au seuil $1-\alpha$.
%\end{bclogo}
%\bigskip
%
%\textbf{\textcolor{red}{Démonstration :}}
%
%\bigskip
%
%On pose $Z_n=\dfrac{X_n-np}{\sqrt{np[1-p]}}$ et on applique le théorème de Moivre-Laplace.
%
%Si $X$ est une variable aléatoire qui suit la loi normale centrée réduite $\mathscr{N}(0~;~1)$, on appelle $u_{\alpha}$ l'unique réel tel que $p\left(-u_{\alpha}\leqslant X\leqslant u_{\alpha}\right)=1-\alpha$. (voir chapitre précédent).
%
%$\lim_{n\rightarrow +\infty}p\left(Z_n\in[-u_{\alpha}~;~u_{\alpha}]\right)=p\left(X\in\left[-u_{\alpha}~;~u_{\alpha}\right]\right)=1-\alpha$.
%
%Or $Z_n\in\left[-u_{\alpha}~;~u_{\alpha}\right]\iff -u_{\alpha}\leqslant \dfrac{X_n-np}{\sqrt{np(1-p)}}\leqslant u_{\alpha}.\iff np-u_{\alpha}\sqrt{np(1-p)}\leqslant X_n\leqslant np+u_{\alpha}\sqrt{np(1-p)}\\
%\iff p-u_{\alpha}\dfrac{p(1-p)}{\sqrt{n}}\leqslant \dfrac{X_n}{n}\leqslant p+u_{\alpha}\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}$ (en divisant tout par $n$).
%\bigskip
%
%Par propriété de la loi normale centrée réduite, on sait que pour $\alpha=0,05$ et donc $1-\alpha=0,95$, on a \\
%$u_{0,05}\approx 1,96$.
%
%\bigskip
%
%\begin{bclogo}[couleur = yellow!30, arrondi = 0.1,logo=\bcbook]{\textcolor{red}{Définition}}
%L'intervalle asymptotique au suis 0,95 de la variable aléatoire fréquence $F$ est défini par :
%\[p-1,96\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}~;~p+1,96\dfrac{\sqrt{p(1-p)}}{\sqrt{n}}.\]
%\end{bclogo}
\bigskip
\textbf{\textcolor{blue}{Exemple} :}
On a une urne contenant des boules bleues et rouges ; la proportion de boules rouges est $p=0,4$.
\noindent On tire 50 boules ; on souhaite déterminer l'intervalle de fluctuation au seuil $\alpha=0,1$.\\
À la calculatrice, on trouve $u_{0,1}\approx 1,645$ (on cherche $\beta$ tel que $F(Z\leqslant \beta)=1-\dfrac{\alpha}{2}=0,95$) où $F$ est la fonction de répartition de la loi normale centrée réduite.
\noindent L'intervalle de fluctuation est donc $I_{50}=\left[0,4-u_{0,1}\dfrac{\sqrt{0,4\times 0,6}}{\sqrt{50}}~;~0,4+u_{0,1}\dfrac{\sqrt{0,4\times 0,6}}{\sqrt{50}}\right]=[0,286~;~0,514]$.
\noindent Ainsi, en effectuant 50 tirages dans cette urne, la fréquence d'apparition d'une boule rouge est comprise entre 0,286 et 0,514 avec une probabilité de 0,9.
\bigskip
\noindent \textbf{\textcolor{red}{Remarque : }}Pour 500 tirages, toujours avec une probabilité de 0,9, on obtient comme intervalle de fluctuation $I_{500}=[0,364~;~0,436]$ ; l'amplitude de l'intervalle a été divisée par plus de trois.
\bigskip
\noindent \textbf{\textcolor{blue}{Cas particulier}} : On sait que, pour $\alpha=0,05$, on a $\boxed{\textcolor{red}{u_{\alpha}\approx 1,96}}$.\\
On en déduit :\\
\bigskip
\begin{bclogo}[couleur = yellow!30, arrondi = 0.1,logo=\bcbook]{\textcolor{red}{Définition}}
L'intervale de fluctuation au seuil de 0,95 de la variable aléatoire fréquence $F$ est défini par : \[\left[p-1,96\times \dfrac{\sqrt{p(1-p)}}{\sqrt{n}}~;~p+1,96\times \dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\right]\]
\end{bclogo}
%\bigskip
%
%Illustration du calcul de $u_{0,05}$ :
%\begin{center}
%\newrgbcolor{zzttqq}{0.6 0.2 0}
%\newrgbcolor{xdxdff}{0.49 0.49 1}
%\psset{xunit=1.0cm,yunit=10.0cm,algebraic=true,dimen=middle,dotstyle=o,dotsize=3pt 0,linewidth=0.8pt,arrowsize=3pt 2,arrowinset=0.25}
%\begin{pspicture*}(-5,-0.1)(7,0.5)
%\psaxes[labelFontSize=\scriptstyle,xAxis=true,yAxis=true,Dx=1,Dy=0.1,ticksize=-2pt 0,subticks=2]{->}(0,0)(-5,-0.1)(5,0.5)
%\pscustom[linecolor=zzttqq,hatchcolor=zzttqq,fillstyle=hlines,hatchangle=45.0,hatchsep=0.02]{\psplot{-1.96}{1.96}{EXP((-(x)^(2))/(1^(2)*2))/(abs(1)*sqrt(PI*2))}\lineto(1.96,0)\lineto(-1.96,0)\closepath}
%\psplot[plotpoints=200]{-5.0}{5.0}{EXP((-(x)^(2))/(1^(2)*2))/(abs(1)*sqrt(PI*2))}
%\psline(1.82,-0.1)(1.82,0.5)
%\psline(-1.96,-0.1)(-1.96,0.5)
%\rput[tl](-0.54,0.2){$\mathscr{A}=0,95$}
%\rput[tl](3.74,0.22){$\dfrac{0,05}{2}=0,025$}
%\psline{->}(3.66,0.14)(2.3,0.02)
%\begin{scriptsize}
%\rput[bl](-8.2,-0.03){$f$}
%\rput[bl](1.98,0.86){$a$}
%\rput[bl](-1.8,0.86){$b$}
%\rput[bl](-0.12,0.02){\zzttqq{$c = 0.95$}}
%%\psdots[dotstyle=*,linecolor=blue](3.66,0.14)
%%\rput[bl](3.74,0.15){\blue{$A$}}
%%\psdots[dotstyle=*,linecolor=blue](2.3,0.02)
%%\rput[bl](2.38,0.03){\blue{$B$}}
%%\rput[bl](3.02,0.08){$u$}
%\psdots[dotstyle=*,linecolor=xdxdff](3.31,0.11)
%\rput[bl](3.38,0.12){\xdxdff{$C$}}
%\end{scriptsize}
%\end{pspicture*}
%\end{center}
\noindent \textbf{\textcolor{red}{Propriété}} : cet intervalle est inclus dans l'intervalle vu en seconde : $\left[p-\dfrac{1}{\sqrt{n}}~;~p+\dfrac{1}{\sqrt{n}}\right]$\\
\noindent \textbf{\textcolor{red}{Démonstration}} : Soit $f:p\mapsto p(1-p))$.\\
$f(p)=p-p^{2}$ ; $f'(p)=1-2p$ ; $f'(p)=0\Leftrightarrow p=\dfrac{1}{2}$ ; $f'(p)\geqslant 0\Leftrightarrow p\leqslant \dfrac{1}{2}$.\\
On en déduit que $f$ est croissante sur $\left[0~;~\dfrac{1}{2}\right]$ puis décroissante sur $\left[\dfrac{1}{2}~;~1\right]$ et ce maximum est $\dfrac{1}{4}$.\\
On peut donc majorer 1,96 par 2 et $\sqrt{p(1-p)}$ par $\sqrt{\dfrac{1}{4}}=\dfrac{1}{2}$ donc $1,96\sqrt{p(1-p)}$ est majoré par $2\times \dfrac{1}{2}=1$.\\
L'intervalle $\left[p-1,96\times \dfrac{\sqrt{p(1-p)}}{\sqrt{n}}~;~p+1,96\times \dfrac{\sqrt{p(1-p)}}{\sqrt{n}}\right]$ est donc inclus dans $\left[p-\dfrac{1}{n}~;~p=\dfrac{1}{n}\right]$.
L'intervalle de fluctuation vu en Terminale est plus précis que celui vu en Seconde.
\bigskip
\subsubsection{\textcolor{blue}{Prendre une décision à partir d'une intervalle de décision}}
\textbf{\textcolor{red}{Remarque}} : pour tester un hypothèse à l'aide d'un intervalle de fluctuation asymptotique, on doit vérifier que les conditions d'utilisation suivantes sont vérifiées :
$n\geqslant 30$~;~$np\geqslant 5$ et $n(1-p)\geqslant 5$.
Si ces conditions sont vérifiées, on calcule l'intervalle de fluctuation asymptotique $I_n$ au seuil $1-\alpha$ (en général, 0,95).
Si la fréquence observée n'appartient pas à l'intervalle $I_n$, on rejette l'hypothèse au seuil d'erreur $\alpha$.\\
Si la fréquence observée appartient à l'intervalle $I_n$, on ne rejette pas l'hypothèse.
%\textbf{\textcolor{blue}{Exemple :}}\\
%
%M. et Mme Parent attendent un enfant. Comme la plupart d'entre nous, ils pensent qu'il y a une chance sur deux d'avoir une fille.\\
%En se rendant sur le site de l'INED, ils apprennent qu'en 2010, en France Métropolitaine, sur un échantillon de \numprint{802224} naissances, il y a eu \numprint{410140} gar\c cons, soit une fréquence $F=0,51$.\\
%On souhaite savoir si cette valeur observée de la fréquence aléatoire $F_{n}$ permet de remettre en cause l'hypothèse du coupe Parent, au seuil de 5\:\%.
%
%
%\begin{enumerate}
%\item On fait l'hypothèse que le couple Parent a raison et qu'une naissance est une expérience aléatoire de probabilité $p=0,5$ d'avoir un gar\c con.\\
%On note $X_{n}$ la variable aléatoire comptant le nombre de gar\c cons d'un échantillon aléatoire de $n$ futures naissances.\\
%
%\noindent $X_{n}$ suit la loi binomiale $\mathscr{B}(\numprint{802224}~;~0,5)$.
%
%\item
%\begin{enumerate}
%\item L'intervalle de fluctuation asymptotique au seuil de 95\:\% est :\\
%$I_{n}=\left[p-1,96\sqrt{\dfrac{p(1-p)}{n}}~;~p+1,96\sqrt{\dfrac{p(1-p)}{n}}\right]=[0,499~;~0,501]$.
%
%\item Les conditions d'application sont vérifiées :\\
%$n=802224>30$ ; $np=n(1-p)=\numprint{401112}>5$.
%\end{enumerate}
%
%\item \textbf{\textcolor{red}{Règle de décision}}\\
%Si la fréquence observée appartient à l'intervalle de fluctuation asymptotique au seuil 95\:\%, alors l'hypothèse sur la valeur $p$ \textbf{\textcolor{blue}{acceptable}} ; sinon, elle est \textbf{\textcolor{blue}{rejetée}} au seuil de 5\:\%.\\
%
%\noindent La fréquence observe 0,51 n'appartient pas à l'intervalle de fluctuation asymptotique ; on peut donc rejeter l'hypothèse d'avoir une chance sur deux d'avoir un gar\c con au seuil de 5\:\%.
%
%\end{enumerate}
\bigskip
\textbf{\textcolor{blue}{Exemple}}
Dans un casino, il a été décidé que les \og{}machines à sous\fg{} doivent être réglées sur une fréquence de gain du jouer de $p=0,06$.
Une fréquence inférieure est supposée faire fuir le client et une fréquence supérieure ruiner le casino.
Trois contrôleurs différents vérifient une même machine.
Le premier a joué 50 fois et gagné 2 fois, le deuxième a joué 120 fois et gagné 14 fois et le troisième a joué 400 lis et ganté 30 fois.
En utilisant à chaque fois l'intervalle de fluctuation asymptotique au seuil 95\:\%, quelle décision a pu rendre le contrôleur ?
\textbf{\textcolor{blue}{Solutions}}:
\begin{enumerate}[$\bullet$]
\item \textbf{Premier contrôleur} : $n=50\geqslant 30$ mais $np=50\times 0,06=3<5$ donc les conditions ne sont pas réunies.
\item \textbf{Deuxième contrôleur} : $n=120>30$ ; $np=7,2>5$ ; $n(1-p)=112,8>5$ : les conditions sont réunies.
$I_{120}=\left[0,06-1,96\times \dfrac{\sqrt{0,06\times 0,94}}{\sqrt{120}}~;~0,06+1,96\times \dfrac{\sqrt{0,06\times 0,94}}{\sqrt{120}}\right]\approx [\numprint{0,0175}~;~\numprint{0,1025}]$.
La fréquence observée est $f_2=\dfrac{14}{120}\approx \numprint{0,1167}\notin I_{120}$. Le contrôleur est conduit à rejeter l'hypothèse que $p=0,06$ (il a trop souvent gagné).
\item \textbf{Troisième contrôleur} : $n=400>30$ ; $np=24>5$ ; $n(1-p)=376>5$ : les conditions sont réunies.
$I_{400}=\left[0,06-1,96\times \dfrac{\sqrt{0,06\times 0,94}}{\sqrt{400}}~;~0,06+1,9§\times \dfrac{\sqrt{0,06\times 0,94}}{\sqrt{400}}\right]\approx [\numprint{0,0367}~;~\numprint{0,0833}]$.
La fréquence observée est $f_3=\dfrac{30}{400}=\numprint{0,075}\in I_{400}$.. Le contrôleur est conduit à ne pas rejeter l'hypothèse que $p=0,06$
\end{enumerate}
\subsection{\textcolor{red}{Intervalle de confiance}}
Dans ce paragraphe, la proportion $p$ du caractère étudié dans la population est inconnue ; on essaye de l'estimer à partit d'un échantillon pris dans la population.
\bigskip
\begin{bclogo}[couleur = yellow!30, arrondi = 0.1,logo=\bcbook]{\textcolor{red}{Définition}}
Pour tout $\alpha\in]0~;~1[$, un \textbf{intervalle de confiance} pour une proportion $p$ au niveau de confiance $1-\alpha$ est la réalisation, à partir d'un échantillon, d'un \textbf{intervalle aléatoire} contenant la proportion $p$ avec une probabilité supérieure ou égale à $1-\alpha$.
\end{bclogo}
\bigskip
\bigskip
Il y a plusieurs intervalles de confiance possibles.\\
En Terminale, on considère celui-là :
\bigskip
\begin{bclogo}[couleur = cyan!20, arrondi = 0.1,logo=\bcbook]{\textcolor{red}{Propriété}}
L'intervalle de confiance au niveau de confiance de 95\:\% est l'intervale $I=\left[f-\dfrac{1}{\sqrt{n}}~;~f+\dfrac{1}{\sqrt{n}}\right]$où $f$ ets la fréquence observée du caractère sur un échantillon de taille $n$.
\end{bclogo}
\bigskip
\textbf{\textcolor{red}{Exemple 1 :}}
Lors d'un scrutin électoral, on souhaite connaître la proportion $p$ de français votant pour le candidat \og{} A\fg. \\
L'institut SOFOS mène une enquête auprès de \numprint{1000} personnes tirées au hasard et avec remise (c'est-à-dire qu'une même personne peut éventuellement être choisie plusieurs fois). Le résultat indique qu'une proportion $f= 49\:\%$ d'entre elles voteront pour le candidat \og{} A\fg{}.
\begin{enumerate}
\item Quelle est la loi suivie par le nombre de personnes votant pour \og{} A\fg{} dans une enquête avec remise effectuée auprès de \numprint{1000} personnes ?
\item Étant donné le résultat de l'enquête SOFOS. donner un intervalle de confiance à 95\:\% pour l'estimation de $p$.
\item Peut-on affirmer d'après l'enquête que le candidat \og{}A\fg{} n'aura pas la majorité des votes, c'est- à-dire que p < 0,5 ?
\end{enumerate}
\textbf{\textcolor{red}{Solution}}
\begin{enumerate}
\item À chaque étape de l'enquête, il y a une probabilité $p$ de tirer une personne votant pour \og{} A \fg{}, car on procède à des tirages avec remise. De plus, les \numprint{1000} tirages sont effectués de façon indépendante. L'enquête est donc un schéma de Bernoulli dont chaque succès correspond à tirer une personne votant pour \og{} A \fg{}, \\
Le nombre de personnes votant pour \og{}A\fg{} dans l'enquête suit donc une loi binomiale $\mathscr{B(\numprint{1000}~;~p)}$ où $p$ est inconnu.
\item Notons $F$ la proportion de personnes votant pour \og{}A\fg{} parmi \numprint{1000}.\\
D'après le cours, si $n\geqslant 30$, $np > 5$ ,$n(1-p)>5$, un intervalle de confiance au niveau 95\\\% pour $p$ est $\left[F-\dfrac{1}{\sqrt{\numprint{1000}}}~;~F+\dfrac{1}{\sqrt{\numprint{1000}}}\right]$.\\
Ici, $n=\numprint{1000}>30$, $np\geqslant 5\Leftrightarrow p\geqslant 0,005$ et $n(1-p)\geqslant 5\Leftrightarrow p\leqslant 0,995$.\\
On ne connaît pas $p$, mais au vu de l'enquête, $f=0,49$, donc on peut raisonnablement penser que $p$ les conditions sont vérifiées.\\
L'intervalle de confiance est $\left[0,49-\dfrac{1}{\sqrt{\numprint{1000}}}~;~0,49+\dfrac{1}{\sqrt{\numprint{1000}}}\right]=[0,458~;~0,522]$.
\item L'intervalle de confiance précédent montre qu'il est tout à fait possible que $p\geqslant 0,5$.\\
Donc il n'est pas raisonnable d'affirmer suite à l'enquête que le candidat \og{}A\fg{} n'obtiendra pas majorité des votes.
\end{enumerate}
\bigskip
\noindent \textbf{\textcolor{red}{Exemple 2 :}}
\noindent Dans une urne contenant des boules rouges et bleues en proportions inconnues, on effectue des tirages au hasard avec remise.
\begin{enumerate}
\item Après avoir effectué 100 tirages, on compte 52 boules rouges et 48 boules bleues.\\
Donner un intervalle de confiance à 95\:\% de la proportion $p$ de boules rouges dans l'urne.
\item Combien faudrait-il, au minimum, effectuer de tirages pour obtenir un intervalle de confiance à 95\:\% de longueur inférieure ou égale à $2\times 10^{-2}$ (c'est-à-dire une précision d'au moins 0,02) ?
\end{enumerate}
\newpage
\textbf{\textcolor{blue}{Solutions}}
\begin{enumerate}
\item Avec $n = 100$ et $f = 0,52$, on a $f - \dfrac{1}{\sqrt{n}}=0,42$ et $f +\dfrac{1}{\sqrt{n}} = 0,62$. Un intervalle de confiance à 95\:\% de la proportion $p$ de boules rouges dans l'urne est: [0.42~;~0,62].
\item On cherche le plus petit entier naturel $n$ tel que $\dfrac{1}{\sqrt{n}}\leqslant 10^{-2}$. On trouve $n\geqslant 10^{4}$.\\
En prélevant au moins \numprint{10000} boules, on obtient un intervalle de confiance à 95\:\% à la précision 0,02.
\end{enumerate}
\bigskip
\noindent \textbf{\textcolor{red}{Exemple 3 :}}
\noindent Une usine fabrique des pièces métalliques, qui sont censée résister à certaines contraintes mécaniques. Le responsable de fabrication souhaite estimer le taux de pièces défectueuses concernant la résistance mécanique dans la population.
\noindent Pour cela, il utilise la méthode par intervalle de confiance au niveau 95\:\%, en extrayant au hasard $n$ pièces en fin de production qui sont soumises à contrainte mécanique jusqu'à la rupture. En fonction du niveau de contrainte à la rupture, on décide de la nature défectueuse ou pas de la pièce.
\begin{enumerate}
\item Chaque pièce testée étant détruite, le responsable souhaite minorer la taille de l'échantillon testé, tout en ayant un intervalle de confiance de de longueur inférieure à 0,1.
Quelle taille d'échantillon lui conseiller ?
\item Il est décide de mener l'étude sur 100 pièces ; on trouve 40 pièces défectueuses. Quel intervalle de confiance au niveau de confiance 95\:\% obtient-on ?
\item L'année précédente, à l'issue d'un problème grave de rupture d'une pièce, une large étude avait débouché sur 130 pièces défectueuses sur un échantillon de \numprint{1000}.
Peut-on supposer que la mise en place de nouvelles procédures de fabrication a vraiment diminué a proportion de pièces défectueuses ?
\end{enumerate}
\bigskip
\textbf{\textcolor{red}{Solution}}
\begin{enumerate}
\item
La longueur d'un intervalle de confiance est $\dfrac{2}{\sqrt{n}}$.
\noindent On doit avoir $\dfrac{2}{\sqrt{n}}\leqslant 0,1$ d'où $\boxed{\textcolor{red}{n\geqslant 400}}$.
Il faut donc tirer au moins 400 pièces.
\item La fréquebce est $f=\dfrac{40}{500}=0,08$.
L'intervalle de confiance est est alors $I:\left[0,08-\dfrac{1}{\sqrt{500}}~;~0,08+\dfrac{1}{\sqrt{500}}\right]\approx \boxed{\textcolor{red}{[\numprint{0,0353}~;~\numprint{0,1247}]}}$.
\item La fréquence observée est $f'=\dfrac{130}{\numprint{1000}}=0,13$.
L'intervalle de confiance au seuil 95\:\% est alors $I'=\left[0,13-\dfrac{1}{\sqrt{\numprint{1000}}}~;~0,13+\dfrac{1}{\sqrt{\numprint{1000}}}\right]\approx [\numprint{0,0984}~;~\numprint{0,1616}]$.
Les deux intervalles de confiance obtenus ne sont pas disjoints ; il est possible que la proportion de pièces défectueuses n'ait pas changé.
\end{enumerate}
\subsection{\textcolor{red}{Exercices (livre Math'x)}}
Pour décider la construction d'un grand stade, une municipalité veut sonder la population pour estimer si plus de 50\:\% des électeurs y sont favorables.
\begin{enumerate}[1.]
\item La municipalité réalise un sondage aléatoire de taille 100 et obtient 54 avis favorables.
\begin{enumerate}[a)]
\item Quelle est la fréquence $f$ d'avis favorables sur ce sondage ?
\item La municipalité peut-elle décider la construction du stade en prétextant que plus de 50\:\% de la population est favorable?
\end{enumerate}
\item
On suppose que la municipalité réalise un sondage de taille $n$ et que la fréquence $f$ des votes favorables reste égale à 0,54.\\
Si $p$ est la proportion (inconnue) d'avis favorables dans la population, donner l'expression d'un intervalle de confiance de $p$ au niveau de 95\:\%.
\item La municipalité ne construira le stade que si la proportion $p$ d'avis favorables dépase 50\:\%.
\begin{enumerate}[a)]
\item Montrer que pour avoir $p > 0,5$, au seuil de confiance de 95\:\%, il suffit d'avoir: $0,54 - \dfrac{1}{\sqrt{n}}>0,5$.
\item Déterminer le plus petit entier $n_{0}$ à partir duquel l'inéquation est vérifiée.
\item Si le sondage, avec la même fréquence observée portait sur 650 personnes, pensez-vous que le stade serait construit ?
\end{enumerate}
\textbf{\textcolor{blue}{Solutions}}
\begin{enumerate}[1.]
\item
\begin{enumerate}[a)]
\item $f=0,54$
\item Au niveau de confiance de 95\:\%, l'intervalle de confiance est $\left[0,54-\dfrac{1}{\sqrt{100}}~;~0,54+\dfrac{1}{\sqrt{100}}\right]=[0,44~;~0,64]$.\\
On ne peut pas affirmer, au niveau de confiance de 95\:\%, $p>0,5$. La réponse est non.
\end{enumerate}
\item $I_{n}=\left[0,54-\dfrac{1}{\sqrt{n}}~;~p+\dfrac{1}{\sqrt{n}}\right]$.
\item
\begin{enumerate}[a)]
\item Pour avoir $p>0,5$, il suffit, au niveau de confiance de 95\:\%, d'avoir $0,54-\dfrac{1}{\sqrt{n}}>0,5$.
\item Cela équivaut à $n>625$ donc $n_{0}=626$.
\item Pour $n=650$, on aurait $p>0,5$ avec un niveau de confiance de 95\:\%. Le stade serait construit.
\end{enumerate}
\end{enumerate}
\end{enumerate}
\label{fin}
\end{document}