@@ -2974,785 +2974,29 @@ que la fréquence de Nyquist de notre signal, on verra apparaître le phénomèn
\chapter{Probabilités et statistiques}
Le but de ce chapitre est d'étudier des phénomènes (expériences) aléatoires;
de calculer les chances (ou la probabilité) qu'un événement
qui n'est pas déterministe se produise.
Il existe une très grande variétés de ces phénomènes. Il en existe
dans presque tous les phénomènes physiques, dans la météorologie,
l'écoulement de fluides, etc. L'étude des probabilité est évidemment également présente
dans l'analyse de risque pour les assurances.
En informatique également il existe un très vaste champs d'application des probabilités.
Une application peut-être liée à la chance qu'un composant (processeur, mémoire, etc)
produise un résultat erroné. Cette théorie est également utilisée pour la cryptographie.
Les applications les plus courantes et peut-être les
plus intuitives sont les jeux de hasard (lancer de dé, roulette, blackjack, etc).
Et c'est pas cela qu'on va commencer.
\section{Exemple du jeu de dé}
On considère un dé à 6 faces. Le lancer de dé est une \textit{expérience aléatoire}, car
on ne peut dire quel sera le résultat avant d'avoir effectué l'expérience.
Avant de commencer à étudier les probabilités du lancer de dé, et les questions qu'on peut se poser, faisons d'abord un peu de vocabulaire
qui sera utile pour la suite.
\begin{itemize}
\item[$\bullet$] L'ensemble des résultats possibles du lancer de dé est $\Omega=\{1,2,3,4,5,6\}$ et cet ensemble est appelé l'\textit{univers} du lancer de dé.
\item[$\bullet$] Chaque résultat possible du lancer de dé ($1$, $2$, etc), noté $\omega\in\Omega$, est appelé une \textit{éventualité}.
\item[$\bullet$] Un ensemble de résultats possibles, par exemple tous les résultats pairs du lancer de dé $A=\{2, 4, 6\}\in\Omega$, s'appelle un \textit{événement}.
Un événement composé d'une seule éventualité est appelé \textit{événement élémentaire}.
\item[$\bullet$] On dit que l'événement $A$ est \textit{réalisé} si on obtient $2$, $4$, ou $6$ en lançant le dé.
\item[$\bullet$]\textit{L'événement certain} est l'univers en entier. On est certain de réaliser l'événement.
\item[$\bullet$]\textit{L'événement impossible} est l'ensemble vide, $A=\emptyset$. Il correspondrait à l'événement obtenir $7$ ou plus en lançant un dé par exemple.
\item[$\bullet$] Si $A$ est un événement, on note $p(A)$ la \textit{probabilité} que $A$ soit réalisé.
\end{itemize}
Si maintenant nous voulons connaître la probabilité de tirer $6$, ou encore la probabilité de réaliser $A=\{6\}$.
Cela est assez intuitif pour le cas du dé. Nous avons $6$ éléments dans l'univers
du lancer de dé. La probabilité de réaliser $A=\{6\}$ est donc
\begin{equation}
p(6)=\frac{1}{6}.
\end{equation}
Pour le cas du lancer de dé, on dit qu'on a un processus qui est \textit{équiprobable}. En effet,
la probabilité de réaliser chacun des événements élémentaires est la même. On a en effet la même probabilité de tirer
$1$, $2$, $3$, $4$, $5$, ou $6$.
Si à présent, on se pose la question de la probabilité de réaliser un tirage pair, $A=\{2,4,6\}$,
alors on trouve
\begin{equation}
p(\mbox{tirer un nombre pair})=\frac{1}{2}.
\end{equation}
De façon générale pour le lancer de dé, on a que la probabilité de réaliser l'événement $A$ est
\begin{equation}
p(A)=\frac{\mbox{nombre d'éléments dans }A}{\mbox{nombre d'éléments dans }\Omega}.
\end{equation}
Si maintenant, on veut savoir quelle est la probabilité de tirer n'importe quel élément dans l'univers, on a
\begin{equation}
p(\Omega)=\frac{\mbox{nombre d'éléments dans }\Omega}{\mbox{nombre d'éléments dans }\Omega}=1.
\end{equation}
De même la probabilité de réaliser l'événement impossible est de
\begin{equation}
p(\emptyset)=\frac{\mbox{nombre d'éléments dans }\emptyset}{\mbox{nombre d'éléments dans }\Omega}=0.
\end{equation}
On voit ici une propriété fondamentale des probabilités qui est que $0\leq p(A)\leq1,\ \forall A$.
La probabilité de ne pas tirer un 6 donc de réaliser l'événement $\bar A=\{1,2,3,4,5\}$ est donné par
$1$ moins la probabilité de réaliser $A=\{6\}$, il vient
\begin{equation}
p(\bar A)=1-p(A)=\frac{5}{6}.
\end{equation}
De même la probabilité de tirer un nombre impair, est donnée par $1$ moins la probabilité de réaliser
On voit donc qu'on a rajouté $m+1$ termes à cette permutation. Comme on a que pour chaque permutation de l'équation
\eqref{eq_permutations} on fait de même. On a que le nombre total de permutations doit être multiplié par $m+1$.
On déduit donc que $\card(\perm(m+1))=(m+1)!$, et on a prouvé notre récurrence.
Dans la pratique le terme ``nombre de permutations'' peut ne pas être très simple à interpréter. Pour tenter de le traduire
dans un langage humain plus compréhensible, on peut se dire que le nombre de permutations d'un ensemble correspond au nombre de façon de classer
ses éléments sans remise et en tenant compte de l'ordre des éléments tirés.
\begin{exercices}
Résoudre les exercices suivants.
\begin{enumerate}
\item Soit une voiture à $4$ places. On a $4$ passagers et toutes ont le permi de conduire. Combien y a-t-il de dispositions possibles dans la voiture?
\item Soient 5 étudiants dans une salle d'informatique possédant 5 ordinateurs
sur une table. Parmis ces étudiants, 2 utilisent l'éditeur \texttt{vi} et 3 l'éditeur \texttt{emacs}. Sachant que les utilisateur de \texttt{vi} et d'\texttt{emacs} ne peuvent se mélanger (s'intercaler)
combien de dispositions possibles y a-t-il pour asseoir les étudiants? (Indication: traîter d'abord indépendamment les utilisateuirs de \texttt{vi} et \texttt{emacs}, puis combiner les deux.)
\item On a un groupe de programmeurs assis autour d'une table ronde. Dans ce groupe il y a 5 programmeurs fortran, 4 programmeurs c++, et 3 programmeurs scala. Sachant que les programmeurs des différents langages ne peuvent se mélanger car ils se méprisent mutuellement pour leur goûts douteux de langages de programmation. Combien de dispositions autour de la table sont possibles? (Indication: procéder comme à l'exerice précédent.)
\end{enumerate}
\end{exercices}
\subsection{Les arrangements}
\begin{definition}[Le $n$-uplet]
Soit $n\in\natural$ et $A$ un ensemble fini. Un $n$-uplet d'éléments de $A$
est une suite ordonnée de $n$ éléments de $A$. Ces éléments peuvent être distincts
ou confondus.
On note $A^n$ l'ensemble de tous les $n$-uplets de $A$.
\end{definition}
\begin{definition}[Arrangement]
Soit $n\in\natural$ et $A$ un ensemble fini. Un
arrangement de $n$ éléments de $A$
est $n$-uplet d'éléments distincts de $A$.
\end{definition}
Par rapport à la permutation d'un ensemble $A$, un arrangement de $A$ est plus général,
car il n'est pas forcémnt composé de tous les éléments de $A$.
Nous voulons maintenant dénombrer les arrangements d'un ensemble $A$. Pour ce faire on doit
introduire une nouvelle notation.
On note $A_n$ un ensemble contenant $n$ éléments ($n\in\natural$).
Et on prend $0\leq p\leq n$ un autre entier. Finalement, on note
les arrangement de $p$ éléments dans l'arrangement $A_n$ comme $A^p_n$.
On veut à présent dénombrer le nombres d'arrangement de $p$ éléments dans un ensemble
en contenant $n$. Comme dans la sous-section précédente, faisons un exemple.
Considérons un ensemble à 4 éléments $A_4=\{1,2,3,4\}$. Il existe
4 arrangements possibles qui soient non vides.
\begin{enumerate}
\item L'arrangement $A_4^1$. Cet arrangement contenant un unique élément est donné par
$A_4^1=\{1,2,3,4\}$. Il est donc de cardinalité $4$. On peut aussi l'écrire
\begin{equation*}
\card(A_4^1)=4.
\end{equation*}
\item L'arrangement $A_4^2$. Cet arrangement est donné par \\
$A_4^2=\{12, 21, 13, 31, 14, 41, 23, 32, 24, 42, 34, 43\}$. Il est donc de cardinalité $12$.
\begin{equation*}
\card(A_4^2)=4\cdot 3.
\end{equation*}
\item L'arrangement $A_4^3$. Cet arrangement est donné par
Dans la pratique le terme ``nombre d'arrangements $p$ parmis $n$'' peut ne pas être très simple à interpréter. Pour tenter de le traduire
dans un langage humain plus compréhensible, on peut se dire que le nombre d'arrangements d'un ensemble correspond au nombre de façon de tirer au sort $p$ éléments parmis $n$
sans remise en tenant compte de l'ordre des éléments tirés.
\begin{exercices}
Résoudre les exercices suivants.
\begin{enumerate}
\item On a une salle avec 5 chaises. Entrent 3 étudiants. Combien de façon y a-t-il
d'asseoir les étudians sur les chause?
\item On considère qu'on a un processeur possédant 8. Nous avons un programme qui
exécute 5 tâches distinctes. Combien de répartitions existe-t-il pour ces tâches?
\item On considère un générateur de mot de passe qui peut utiliser les 26 lettres de l'alphabet. Combien de mots de passes de 6 caractères peuvent-ils être générés? De 8 caractères? de 10 caractères?
\item On considère un générateur de mot de passe qui peut utiliser les 95 (estimation basse du nombre de caractères disponibles sur un clavier) lettres de l'alphabet. Combien de mots de passes de 6 caractères peuvent-ils être générés?
\end{enumerate}
\end{exercices}
\subsection{Les combinaisons}
\begin{definition}[Combinaison]
Soient $p\in\natural$ et $n\in\natural$, avec $0\leq p\leq n$. Soit $A$ un ensemble
contenant $n$ éléments. Une combinaison de $p$ éléments de $A$ est un sous-ensemble de $p$ éléments de $A$. L'ordre n'a aucune importance dans la notion de combinaison.
On note la combinaison de $p$ parmis $n$, $C_n^p$.
\end{definition}
Nous voulons connaître à présent le nombre d'élément dans une combinaison. Vous avez l'habitude de la marche à suivre. Nous allons faire un exemple pour essayer de
déterminer une formule générale pour la combinaison de $p$ parmi $n$.
Considérons un ensemble à 4 éléments $A_4=\{1,2,3,4\}$. Il existe
4 combinaisons possibles qui soient non vides.
\begin{enumerate}
\item La combinaison $C_4^1$. Cette combinaison est donnée par
\begin{equation*}
C_4^1=\{1,2,3,4\}.
\end{equation*}
Il est donc de cardinalité $4$. On peut aussi l'écrire comme
\begin{equation*}
\card(C_4^1)=\card(A_4^1).
\end{equation*}
\item La combinaison $C_4^2$. Cette combinaison est donnée par
\begin{equation*}
C_4^1=\{12, 13, 14, 23, 24, 34\}.
\end{equation*}
Il est donc de cardinalité $6$. On peut aussi l'écrire comme
\begin{equation*}
\card(C_4^2)=\frac{\card(A_4^2)}{2}.
\end{equation*}
\item La combinaison $C_4^2$. Cette combinaison est donnée par
\begin{align*}
C_4^3=\{123, 124, 134, 234\}.
\end{align*}
Il est donc de cardinalité $4$. On peut aussi l'écrire comme
Dans la pratique le terme ``nombre de combinaisons $p$ parmis $n$'' peut ne pas être très simple à interpréter. Pour tenter de le traduire
dans un langage humain plus compréhensible, on peut se dire que le nombre de combinaisons d'un ensemble correspond au nombre de façon de tirer au sort $p$ éléments parmis $n$
sans remise et ne tenant pas compte de l'ordre des éléments tirés.
\begin{exercices}
Résoudre les exercices suivants.
\begin{enumerate}
\item On considère un nuage de $6$ points. Combien y a-t-il de droites reliants ces $6$ points?
\item Considérons une association de 20 membres. Cette association a un comité de direction formé de 3 membres. Un comité ne peut pas être identique à un comité passé. Combien d'année faut-il attendre pour que cette règle pose un problème si les membres de l'association ne changent pas?
\item Combien y a-t-il de tirages possibles au swiss lotto? Et à l'euromillions?
\item Combien y a-t-il de jeux possibles dans une partie de Jass, où chaque où le jeu complet contient 36 cartes et où il y a quatres joueurs qui reçoivent autant de cartes chacuns?
\end{enumerate}
\end{exercices}
\section{Dénombrement et probabilités: mise en pratique}
\begin{exercices}[L'examen d'ITI]
Le champs de l'examen du cours de probabilités est composé de 40 sujets.
Sur ces 40 sujets 4 seront tirés au hasard pour l'examen.
\begin{enumerate}
\item Combien d'examens sont organisables?
\item Un candidat n'ayant révisé que 25 sujets se présente à l'examen. Quelle est la probabilité qu'il puisse traiter tous les sujets? trois sujets? deux sujets? un sujet? aucun sujet?
\item Combien de sujets un étudiant doit-il réviser pour avoir une probabilité de 99\% de pouvoir tous les traîter?
\end{enumerate}
\end{exercices}
\begin{exercices}[Faille du WPS]
Le WPS (ou Wi-Fi protected setup) est un système qui permet de se connecter à un routeur
sans utiliser l'identification WPA directement qui existe en 2007. Il existe 3-4 façons de l'appliquer. Celle qui nous intéresse
est celle constituée d'un code. Ce code PIN est un nombre à 8 chiffres.
\begin{enumerate}
\item Calculer le nombre de PIN possibles. Combien d'essai sont nécessaires pour avoir 50\% de chances de trouver le PIN?
\item En fait le 8ème chiffre est un checksum des 7 premiers chiffres. Combien reste-t-il de PIN possibles?
Combien d'essai sont nécessaires pour avoir 50\% de chances de trouver le PIN?
\item En 2011, on a découvert (un certain Stefan Viehböck) que lorsqu'on fait une tentative
de connexion avec le code PIN le routeur donne la validité des 4 premiers et 3 derniers chiffres indépendamment. Combien de
possibilités reste-t-il? Combien d'essais sont nécessaires pour avoir 50\% de chances de trouver le PIN? En supposant qu'on ne peut faire
qu'un essai par seconde, combien de temps faut-il pour pour effectuer ces essais?
\end{enumerate}
En fait ce que j'ai découvert en essayant l'utilitaire Reaver sur mon routeur, c'est que non seulement on peut hacker
un routeur en très peu de temps, mais en plus on obtient le mot de passe WPA du routeur. Si comme la plupart des gens l'utilisateur
a configuré son wi-fi avec le même mot de passe que pour son mail, son compte en banque, etc. On peut vraiment accéder à
un nombre considérable de données...
\end{exercices}
%
\begin{exercices}[Les souris]
Dans un laboratoire on a une cage contenant 100 souris. Elles présntent deux caractères qui sont
importants pour nous, le sexe (mâle ou femelle) et la couleur (noire ou blanche). Il y a 87 mâles,
57 sont blanches, et 55 sont mâles et blanches.
\begin{enumerate}
\item Faire un tableau à double entrée avec le sexe et la couleur et mettre les effetifs dans chaque case.
\item Si on prend une souris au hasard, quelle est la probabilité qu'elle soit noire? Quelle est la probabilité qu'elle soit femelle?
Quelle est la probabilité qu'elle soit noire ou femelle?
\item Quelle est la probabilité de tirer 5 souris blanches avec remise? Et sans remise?
\item Combien de souris il faut tirer avec remise pour avoir 10\% de chances de tirer 5 souris blanches? Et sans remise?
\end{enumerate}
\end{exercices}
\section{Probabilités conditionnelles}
Commençons cette section par un exemple pour illustrer le concept de probabilités conditionnelles.
Prenons à nouveau un dé à six faces. Nous nous intéressons au calcul de la probabilité de réaliser les événements
(notons les respectivement $A$ et $B$) \textit{tirer un nombre plus grand ou égal à trois} et \textit{tirer un nombre impair}.
Les probabilités de réaliser $A$ et $B$ sont données par
\begin{align}
p(A)&=\frac{4}{6}=\frac{2}{3},\\
p(B)&=\frac{3}{6}=\frac{1}{2}.
\end{align}
Cela n'a rien de nouveau c'est un calcul de probabilités tout ce qu'il y a de plus classique.
Par contre, si on nous dit que nous avons déjà tiré un nombre impair.
Et qu'on veut savoir quelle est la probabilité d'obtenir un nombre plus grand ou égal à 3.
Nous changeons un peu le problème. Nous supposons qu'on a tiré un nombre impair et on veut connaître la probabilité
que ce nombre soit un nombre impair. En termes plus mathématiques, nous voulons savoir quelle est la probabilité que $A$
soit réalisé, sachant que $B$ a été réalisé. Cette probabilité se note $p(A|B)$.
Calculons à présent cette probabilité. Comme on sait que $B$ a été réalisé (nous avons tiré un nombre impair) l'univers
a changé. Il est à présent composé de $\Omega=\{1,3,5\}$ (on a que $\card(\Omega)=3$). Dans cet univers on a deux possibilité de tirer
un nombre plus grand ou égal à trois ($A|B=\{3,5\}$). La probabilité $p(A|B)$ est donc donnée par
\begin{equation}
p(A|B)=\frac{2}{3}.
\end{equation}
Regardons maintenant à quoi correspondent les cardinalités présentent dans la franction ci-dessus.
Le numérateur correspond au nombre d'éléments à la fois dans $A$ et dans $B$ (soit $A\cap B$). Le dénominateur lui
est simplement la cardinalité de l'événement $B$. Donc on peut écrire la formule de façon
\caption{Exemple d'arbre pondéré avec des événements $A$, $B$, $C$, $D$, $E$. Sur les branches du noeuds de départ, nous avons les probabilité de réaliser $A$ et $B$.
Sur toutes les branche en dessous, nous avons les probabilités conditionnelles de réaliser $C$, $D$, ou $E$ sachant que $A$ ou $B$ a été réalisé.}\label{fig_arbre_pondere}
\end{figure}
Nous avons donc que la probabilité reliée au produit de deux branches donne la probabilité de réalisation de l'intersection
de deux événements. En effet, nous avons par exemple pour arriver à l'évenement $E$
\begin{equation}
p(B)p(E|B)=p(B\cap E).
\end{equation}
Si on augmente encore un peu la taille de l'arbre (voir figure \ref{fig_arbre_pondere_2}),
\caption{Exemple d'arbre pondéré avec des événements $A$, $B$, $C$, $D$, $E$, $I$, $J$. Sur les branches du noeuds de départ, nous avons les probabilité de réaliser $A$ et $B$.
Sur toutes les branche en dessous, nous avons les probabilités conditionnelles de réaliser $C$, $D$, ou $E$ sachant que $A$ ou $B$ a été réalisé,
puis nous avons encore un 3ème étage à notre arbre avec les événements $I$ et $J$.}\label{fig_arbre_pondere_2}
\end{figure}
De façon similaire si nous calculons le produit des probabilité pour arriver jusqu'à $I$, on obtient
Ce type d'arbre est donc très pratique pour déterminer les probabilités d'intersection d'événements.
\begin{remarque}
Jusqu'ici, nous avions construit certains arbres où les probabilités conditionnelles n'avaient pas d'importance. En effet, si on tire un dé
deux fois. Le premier lancer donne un chiffre (disons ``1'') avec une probabilité de rélisation de $1/6$,
la probabilité n'importe quel chiffre (disons ``1'' à nouveau) est toujours de $1/6$. Ici le fait d'avoir réalisé un événement,
ne fait pas intervenir la probabilité conditionnelle. En revanche, de façon cachée, l'arbre correspondant au loto, lui fonctionne comme vu ci-dessus.
\end{remarque}
\begin{exercice}
Pour décider de la réussite ou non de l'examen de mathématiques de dexuième année le professeur a décidé d'une façon originale de faire passer l'année.
$20\%$ des élèves passent sur dossier (qualité de la photo sur IS-Academia, quantité de pizza mangée en moins de 30sec, ...). Ensuite
les étudiants restants passent un examen écrit sur un sujet libre (anglais, histoire, ...).
Ceux qui ratent l'écrit sont éliminés. Le professeur
a décidé que seul 75\% des étudiants réussissent l'écrit.
Les étudiants restants passent un examen de chant. Là deux tiers réussissent et passent l'année.
\begin{enumerate}
\item Faire un arbre pondéré de cette situation ``réussi-raté'' .
\item On choisit un étudiant au hasard. Déterminer la probabilité qu'il ait tenté et raté l'épreuve écrite.
\item On choisit un étudiant au hasard. Déterminer la probabilité qu'il soit admis en ayant tenté l'épreuve écrite.
\end{enumerate}
\end{exercice}
\section{Introduction à la statistique descriptive}
En statistique, une \textit{population} est un ensemble d'objets (d'individus) possédants un ou plusieurs \textit{caractères} communs.
L'étude des caractères d'une population a pour but de révéler des tendances au sein de la population. Ces études sont particulièrement
intéressantes quand le nombre d'individus de notre population est trop élevé pour pouvoir être analysé en entier. On prélève alors un échantillon
représentatif de notre population au hasard
et on mène l'analyse statistique sur ce sous ensemble. Les éventuelles conclusions tirées de l'étude statistqiue sur le sous ensemble seront ensuite appliquée
à l'ensemble de la population. Grâce au calcul de propbabilité nous pourrons alors avoir une confiance plus ou moins grande dans les conclusions
tirées en fonction de la taille de l'échantillon. En effet plus celui-ci sera grand, plus la confiance dans les résultats sera élevée.
Un exemple de ce genre d'étude qui est très à la mode ces temps est le sondages (concernant le résultats d'élections ou de votations).
Les sondeurs tentent en questionnant un sous-ensemble
d'environ 1000 d'électeurs d'un pays (citoyens de plus de 18, moitié d'hommes et de femmes plus ou moins, ...) de déterminer
les résultats d'élections ou de votations où participeront des millions d'électeurs potentiels. Il faut avouer que la tâche semble pour
le moins complexe. Et la plus grande difficulté tient dans le ``représentatif de la population''.
\subsection{Représentations}
Il existe différentes façon de représenter les caractères d'une population selon que sa nature est \textit{discrète}
ou \textit{continue}. Dans le cas discret d'un caractère pouvant prendre $k\in\natural$ valeur différentes $\{x_i\}_{i=0}^{k-1}$,
on représente le nombre d'indivius pouvant prendre la valeur $x_k$ par le nombre $n_k$. On a donc un ensemble $\{n_i\}_{i=0}^{n-1}$
d'indivius pour les $k$ valeurs des caratères de la population. Dans le cas continu le nombre d'individus d'un caractère
correspondrant à une subdivision en $k$ parties de l'ensemble des valeurs possibles pour le dit caractère.