diff --git a/01_rappel.md b/01_rappel.md
index a19017f133e278b5d9f251c9a578916f7b216dc8..799a22d5ebe94a36f0927bfe3f9b4a4581f144dd 100644
--- a/01_rappel.md
+++ b/01_rappel.md
@@ -10,7 +10,7 @@ Nous pouvons aussi exprimer cette notion de la manière suivante. Considérons d
 
 ---
 
-#### Exemple (Fonctions, généralités) {-}
+Illustration (Fonctions, généralités) #
 
 1. La tension $U$ est une fonction de la résistance $R$ et du courant
     $I$ $$\begin{aligned}
@@ -33,7 +33,7 @@ $$y=g(f(x)).$$
 
 ---
 
-#### Exemple (Fonctions) {-}
+Illustration (Fonctions) #
 
 1. Soit $f(x)=2\cdot x$ et $g(x)=\sqrt{x}$, alors la composition des
     deux fonctions $$(f\circ g)(x)=f(g(x))=f(\sqrt{x})=2\sqrt{x}.$$
@@ -50,7 +50,7 @@ la variable de départ $$f(f^{-1}(x))=x.$$
 
 ---
 
-#### Exemple (Fonction inverse) {-}
+Illustration (Fonction inverse) #
 
 1. Soient $f(x)=2\cdot x$ et $f^{-1}(x)=x/2$, alors la composition des
     deux fonctions $$f(f^{-1}(x))=f(x/2)=2x/2=x.$$
@@ -67,15 +67,18 @@ la variable de départ $$f(f^{-1}(x))=x.$$
 
 ## Domaine de définition
 
+---
 
-#### Définition (Domaine de définition) {-}
+Définition (Domaine de définition) #
 
 Le domaine de définition, noté $D\subset{\real}$, d’une fonction
 $f$, est l’ensemble de valeurs où $f$ admet une image.
 
 ---
 
-#### Exemple (Domaine de définition) {-}
+---
+
+Illustration (Domaine de définition) #
 
 1. Le domaine de définition de $f(x)=x$ est $D={\real}$.
 
@@ -92,7 +95,9 @@ Soit $f$ une fonction et $D\subseteq{\real}$ non-vide  et soient $a$ et $b$ deux
 
 ### Limite
 
-#### Définition (Limite) {-}
+---
+
+Définition (Limite) #
 
 Pour $f$ définie en $D$,  on dit que $b$ est la
 limite de $x$ en $a$ si si au fur et à mesure que $x$ se rapproche de $a$, $f(x)$ se rapproche de $b$ et nous notons  $\lim\limits_{x\rightarrow a}f(x)=b$.
@@ -107,20 +112,26 @@ Ou encore quand le but est d'écrire ça de la façon la plus compacte possible
 
 $$\forall\varepsilon>0,\exists\delta>0\ |\ \forall x\in D,\ |x-a|<\delta\Rightarrow|f(x)-b|<\varepsilon.$$
 
-#### Remarque {-}
+---
+
+---
+
+Remarque #
 
 Il n'est pas nécessaire que $a\in D$. Mais si c'est le cas et donc
 $f$ est définie en $a$ alors on a $\lim\limits_{x\rightarrow a}f(x)=f(a)$.
 
 ---
 
-#### Exemple (Limite) {-}
+---
+
+Illustration (Limite) #
 
 Si $f(x)=x$, alors $\lim\limits_{x\rightarrow 0}f(x)=0$.
 
 ---
 
-#### Définition (Limite, asymptote) {-}
+Définition (Limite, asymptote) #
 
 Pour $f$ définie en $D$,
 on dit que la limite de $f(x)$ en $a$ est égale à l’infini si pour tout $c>0$ l’intervalle
@@ -129,7 +140,7 @@ $a$. On dit aussi que $f$ tend vers l'infini.
 
 ---
 
-#### Exemple (Limite, asymptote) {-}
+Illustration (Limite, asymptote) #
 
 Si $f(x)=1/x^2$, alors $\lim\limits_{x\rightarrow 0}f(x)=\infty$.
 
@@ -150,11 +161,15 @@ fonction $f$ en $a$.
 Si la fonction $f$ admet une limite en $a$, alors les deux limites
 sont égales.
 
-#### Exemple (Limite à gauche/droite) {-}
+---
+
+Illustration (Limite à gauche/droite) #
 
 Si $f(x)=1/x$, alors $\lim\limits_{x\rightarrow 0^+} f(x)=\infty$ et
 $\lim\limits_{x\rightarrow 0^-} f(x)=-\infty$.
 
+---
+
 ### Comportement asymptotique
 
 Dans certains cas il peut être intéressant d’étudier le comportement des
@@ -202,13 +217,19 @@ $$\lim_{n\rightarrow\infty}\frac{n}{\log(n)}=\frac{A}{\log(10)}\cdot\lim_{p\righ
 
 ## Continuité
 
-#### Définition (Continuité) {-}
+---
+
+Définition (Continuité) #
 
 Soit $f$ une fonction définie sur un intervalle ouvert $D$ contenant
 $a$. On dit que $f$ est continue en $a$ si et seulement si
 $\lim\limits_{x\rightarrow a}f(x)=f(a)$.
 
-#### Propriétés (Fonctions continues) {-}
+---
+
+---
+
+Propriétés (Fonctions continues) #
 
 Soient $f$ et $g$ deux fonctions continues en $a$ et $b$ un réel:
 
@@ -220,23 +241,35 @@ Soient $f$ et $g$ deux fonctions continues en $a$ et $b$ un réel:
 
 4. $h=g\circ f$ est continue en $a$.
 
-#### Définition (Continuité sur un intervalle) {-}
+---
+
+---
+
+Définition (Continuité sur un intervalle) #
 
 Une fonction $f$ est dite continue dans un intervalle $D=]a;b[$ si et
 seulement si elle est continue en tout point de $D$. De plus, elle est
 continue sur $D=[a,b]$ si elle est continue sur $]a;b[$ et continue à
 droite en $a$ et à gauche en $b$.
 
-#### Théorème (Valeurs intermédiaires) {-}
+---
+
+---
+
+Théorème (Valeurs intermédiaires) #
 
 Soit $f$ une fonction continue
 sur $D$, et $a,b$ deux points contenus dans $D$ tels que $a<b$ et
 $f(a)<f(b)$, alors $$\forall y\in [f(a);f(b)],\ \exists\ c\in [a,b] |f(c)=y.$$
 Nous pouvons bien sûr énoncer un résultat similaire dans le cas $f(a9>f(b)$.
 
+---
+
 ## Dérivées
 
-#### Définition (Dérivée en un point) {-}
+---
+
+Définition (Dérivée en un point) #
 
 Soit $f$ une fonction définie sur $D$ et $a\in D$. On dit que $f$ est
 dérivable en $a$ s’il existe un $b$ (appelé la dérivée de $f$ en $a$)
@@ -244,17 +277,29 @@ tel que $$\begin{aligned}
 &\lim\limits_{h\rightarrow 0}\frac{f(a+h)-f(a)}{h}=b,\hbox{ ou}\\
 &\lim\limits_{x\rightarrow a}\frac{f(x)-f(a)}{x-a}=b.\end{aligned}$$
 
-#### Définition (Dérivée sur un intervalle) {-}
+---
+
+---
+
+Définition (Dérivée sur un intervalle) #
 
 Si $f$ est dérivable en tout point de $D=]a;b[$, alors on définit $f'$
 la fonction dérivée de $f$ dans l’intervalle $D$ qui associe en tout
 point $x$ de $D$ la valeur dérivée de $f$.
 
-#### Propriété {-}
+---
+
+---
+
+Propriété #
 
 Si $f$ est dérivable en $a$ alors $f$ est continue en $a$.
 
-#### Propriétés {-}
+---
+
+---
+
+Propriétés #
 
 Soient $f$ et $g$ deux fonctions dérivables sur $D$ (dont les dérivées sont $f'$
 et $g'$), et $a\in{\real}$, alors
@@ -285,14 +330,22 @@ $C\in {\real}$, nous avons
 
 6. $f(x)=\cos(x)$, $f'(x)=-\sin(x$).
 
-#### Définition (Dérivée seconde) {-}
+---
+
+---
+
+Définition (Dérivée seconde) #
 
 Si $f'$ est dérivable sur $D$, alors sa dérivée, notée $f''$, est
 appelée la dérivée seconde de $f$.
 
+---
+
 ### Variation des fonctions
 
-#### Propriétés (Croissance/décroissance) {-}
+---
+
+Propriétés (Croissance/décroissance) #
 
 Soit $f'$ la fonction dérivée de $f$ sur $D$
 
@@ -302,19 +355,29 @@ Soit $f'$ la fonction dérivée de $f$ sur $D$
 
 3. Si $f'=0$ sur $D$, alors $f$ est constante sur $D$.
 
-#### Définition (Maximum/minimum local) {-}
+---
+
+---
+
+Définition (Maximum/minimum local) #
 
 Une fonction admet un maximum local (respectivement minimum local) sur
 un intervalle $D=]a;b[$ s’il existe un $x_0\in D$ tel que $f(x_0)\geq f(x)$
 (respectivement $f(x_0)\leq f(x)$) pour tout $x\in D$.
 
-#### Propriété (Maximum/minimum) {-}
+---
+
+---
+
+Propriété (Maximum/minimum) #
 
 Soient $f$ une fonction dérivable sur $D=]a;b[$ et $x_0\in D$. On dit que $f$
 admet un extremum en $x_0$ si $f'(x_0)=0$. De plus si
 $f'(x_0)=0$ et $f'$ change de signe en $x_0$ alors $f(x_0)$ est un
 maximum ou un minimum de $f$.
 
+---
+
 ## Etude de fonction
 
 Effectuer l’étude de fonction de la fonction suivante
diff --git a/02_optimisation.md b/02_optimisation.md
index 72c2851acfedd75ad5010a19650bf4bef98d9ecb..fe19250c9f9ca105982101367c134b4ce052bdf9 100644
--- a/02_optimisation.md
+++ b/02_optimisation.md
@@ -45,7 +45,7 @@ a &= \frac{C}{B}=\frac{\sum_{i=1}^Nx_iy_i}{\sum_{i=1}^Nx_i^2}.
 
 ---
 
-#### Exemple {-}
+Illustration #
 
 Soient les 4 points $(0, 0.1)$, $(1, 0.3)$, $(2, 0.3)$ et $(3, 0.4)$. La fonction d'erreur $E(a)$ s'écrit
 $$
@@ -196,7 +196,7 @@ distance maximale du zéro de $(b_1+a_1)/2^n$. On dit que cette méthode est d'o
 
 ---
 
-#### Exercice (Racine de polynôme) {-}
+Exercice (Racine de polynôme) #
 
 Déterminer la racine du polynôme $x^4+x^3+x^2-1$ avec $a_1=0.5$ et $b_1=1$ (faire au maximum 6 itérations).
 
@@ -232,7 +232,7 @@ La méthode de la fausse position est plus efficace que la méthode de la bissec
 
 ---
 
-#### Exercice {-}
+Exercice #
 
 Déterminer le zéro positif de la fonction
 $$
@@ -261,7 +261,7 @@ En revanche elle est plus efficace, lorsque qu'elle converge, que ces deux méth
 
 ---
 
-#### Exercice {-}
+Exercice #
 
 Déterminer le zéro positif de la fonction
 $$
@@ -282,7 +282,7 @@ Mais, nous n'avons pas encore vu de méthode pour déterminer les valeur de la f
 
 ---
 
-#### Remarque {-}
+Remarque #
 
 On peut procéder de façon très similaire pour $[a,b]$ tel que
 
@@ -343,7 +343,7 @@ En revanche les contraintes pour sa convergence sont plus strictes que pour les
 
 ---
 
-#### Remarque (non-convergence ou convergence lente) {-}
+Remarque (non-convergence ou convergence lente) #
 
 Il y a un certain nombre de cas où la méthode de Newton ne converge pas.
 
@@ -357,7 +357,7 @@ Il y a un certain nombre de cas où la méthode de Newton ne converge pas.
 
 ---
 
-#### Exercice {-}
+Exercice #
 
 Déterminer le zéro de la fonction
 $$
@@ -375,7 +375,7 @@ Il suffit de remplacer $g(x)$ par $f'(x)$ et le tour est joué.
 
 ---
 
-#### Exercice {-}
+Exercice #
 
 Écrire l'algorithme de Newton pour le cas de la minimisation d'une fonction $f(x)$ quelconque, mais continûment dérivable 2 fois.
 
@@ -398,7 +398,7 @@ f:\real^n\rightarrow \real.
 
 ---
 
-#### Exemple (Régression linéaire) {-}
+Illustration (Régression linéaire) #
 
 Dans le cas de la régression linéaire, si la droite ne passe pas par l'origine, nous avons que
 la fonction de coût qui dépend de deux variables, $a$, et $b$ (et plus uniquement de $a$)
@@ -445,7 +445,7 @@ Comme on le voit ici, pour chaque dérivée partielle, on ne fait varier qu'une
 
 ---
 
-#### Exemple (Dérivée partielle) {-}
+Illustration (Dérivée partielle) #
 
 Les dérivée partielles de la fonction
 $$
@@ -468,7 +468,7 @@ $$
 
 ---
 
-#### Remarque {-}
+Remarque #
 
 Pour une fonction à une seule variable, $f(x)$, on a que
 $$
@@ -488,7 +488,7 @@ pour les façon à une seule variable. Pour une fonction à deux variables, on a
 
 ---
 
-#### Remarque {-}
+Remarque #
 
 Si $f$ est dérivable en $x$ et $y$, on a que 
 $$
@@ -499,7 +499,7 @@ $$
 
 ---
 
-#### Exemple (Dérivées partielles deuxièmes) {-}
+Illustration (Dérivées partielles deuxièmes) #
 
 Pour la fonction $f(x,y)=x^2-y^2$, on a
 \begin{align}
@@ -549,7 +549,7 @@ $$
 
 ---
 
-#### Exemple (Gradient d'une fonction à deux variables) {-}
+Illustration (Gradient d'une fonction à deux variables) #
 
 Pour la fonction $f(x,y)=x^2-y^2$, le gradient est donné par
 $$
@@ -610,7 +610,7 @@ Le taux de variation maximal est donc la longueur du vecteur $\vec \nabla f$.
 
 ---
 
-#### Remarque (Généralisation) {-}
+Remarque (Généralisation) #
 
 Tout ce que nous venons d'écrire ici se généralise à un nombre arbitraire de dimensions.
 
@@ -711,7 +711,7 @@ Même si cela ne suffit pas à prouver mathématique que $\vec 0$ est le minimum
 
 ---
 
-#### Question {-}
+Question #
 
 Avec ce qui précède, voyez-vous une façon de trouver le minimum de la fonction $f(x,y)$?
 
@@ -740,7 +740,7 @@ peut se voir dans la @fig:gradient.
 
 ---
 
-#### Exemple (quelques itérations) {-}
+Illustration (quelques itérations) #
 
 Prenons la fonction objectif $f(x,y)$ suivante
 $$
diff --git a/03_integrales.md b/03_integrales.md
index 8f1ffc2b097ebe3733f3a5e67702addc6766436f..1fc29f49f90205530508098fb6056ab683393dd2 100644
--- a/03_integrales.md
+++ b/03_integrales.md
@@ -72,10 +72,6 @@ Exemple (Intégration de Riemann) #
 
 Intégrer de $f(x)=x$ dans intervalle $[0,1]$.
 
----
-
----
-
 Solution (Intégration de Riemann) #
 
 Il est élémentaire de calculer que cette aire vaut $1/2$ (c’est l’aire d’un
@@ -97,7 +93,7 @@ $\sup\limits_{[x_i,x_{i+1}]}f(x)=f(x_{i+1})$. On a donc que
 
 ---
 
-Exemple (Intégration de Riemann de $x^2$) #
+Exercice (Intégration de Riemann de $x^2$) #
 
 Calculer l’aire sous la courbe de $f(x)=x^2$ dans intervalle $[0,1]$.
 
diff --git a/04_edo.md b/04_edo.md
index 3606bf93283c2562eea66b5f6c1a7c2a3002b5b6..cef10024c3aa3d9bb57ca9c44d47dd1fd8670ea5 100644
--- a/04_edo.md
+++ b/04_edo.md
@@ -37,13 +37,17 @@ $$x(t_0)=x_0=v\cdot t_0+B \Leftrightarrow B=x_0-v\cdot t_0.$$
 Finalement, la solution du problème différentiel est donnée par
 $$x(t)=v\cdot (t-t_0)+x_0.$$
 
-#### Remarque {-}
+---
+
+Remarque #
 
 La solution de l’équation différentielle $$x'(t)=v,\ x(t_0)=x_0,$$
 revient à calculer $$\begin{aligned}
  \int x'(t){\mathrm{d}}t=\int v {\mathrm{d}}t,\\
  x(t)=v\cdot t + B.\end{aligned}$$
 
+---
+
 ### Mouvement rectiligne uniformément accéléré
 
 Dans le cas du mouvement rectiligne d’un objet dont on le connaît que
@@ -77,7 +81,9 @@ $$x(t_0)=x_0=\frac{a}{2}\cdot t_0^2+D \Leftrightarrow D=x_0-\frac{a}{2}\cdot t_0
 Finalement la solution est donnée par
 $$x(t)=\frac{a}{2}\cdot (t^2-t_0^2)+v_0\cdot (t-t_0)+x_0.$$
 
-#### Remarque {-}
+---
+
+Remarque #
 
 La solution du problème différentiel peut également se calculer de
 la façon suivante $$x''(t)=a,\ x(t_0)=x_0,\ v(t_0)=v_0.$$ revient à
@@ -85,6 +91,8 @@ calculer $$\begin{aligned}
  \int \int x''=\int \int a,\\
  x(t)=\frac{a}{2}t^2+C\cdot t + D.\end{aligned}$$
 
+---
+
 ### Évolution d’une population
 
 Imaginons une colonie de bactéries dont nous connaissons le taux de
@@ -257,7 +265,9 @@ ans.](figs/interets.svg){#fig:interets width="50.00000%"}
 Définitions et théorèmes principaux
 -----------------------------------
 
-#### Définition (Équation différentielle ordinaire) {-}
+---
+
+Définition (Équation différentielle ordinaire) #
 
 Soit $y$ une fonction dérivable $n$ fois et dépendant d’une seule
 variable. Une **équation différentielle ordinaire** est un équation de
@@ -267,7 +277,9 @@ $n$-ème de $y$.
 
 ---
 
-#### Illustration {-}
+---
+
+Illustration #
 
 L’équation suivante est une équation différentielle ordinaire
 $$y''+4y'+8y+3x^2+9=0.$$
@@ -281,24 +293,36 @@ différentielle.
 Afin de classifier les équation différentielles, considérons les
 définitions suivantes
 
-#### Définition (Ordre)  {-}
+---
+
+Définition (Ordre)  #
 
 L’ordre d’une équation différentielle est l’ordre le plus haut des
 dérivées de $y$ qui y apparaissent. L’ordre de l’équation différentielle
 $F(x,y,y',y'',...,y^{(n)})=0$ est de $n$, si $n\neq 0$.
 
-#### Illustration {-}
+---
+
+---
+
+Illustration #
 
 L’équation différentielle suivante est d’ordre $3$
 $$4y'''+x\cdot y'+4y+6x=0.$$
 
-#### Définition (Condition initiale) {-}
+---
+
+---
+
+Définition (Condition initiale) #
 
 Une condition initiale pour une équation différentielle d’ordre $n$, est
 un ensemble de valeurs, $y_0$, $y_1$, ..., $y_{n-1}$ donnée telles que
 pour une valeur $x_0$ donnée on a
 $$y(x_0)=y_0,\ y'(x_0)=y_1,\ ...,\ y^{(n-1)}(x_0)=y_{n-1}.$$
 
+---
+
 Nous souhaitons maintenant savoir sous quelles conditions une équation
 différentielle admet une solution et si elle est unique. Nous n’allons
 pas vraiment écrire ni démontrer le théorème d’existence et d’unicité
@@ -307,7 +331,7 @@ version approximative et la discuter
 
 ---
 
-#### Théorème (Existence et unicité) {-}
+Théorème (Existence et unicité) #
 
 Soit $D\subseteq{\real}$ le domaine de définition de la fonction
 $y$. Soit $y:D\rightarrow E\subseteq {\real}$ une fonction à valeur
@@ -345,7 +369,7 @@ peu les équations différentielles en fonction des propriétés de $F$.
 
 ---
 
-#### Définition (Linéarité) {-}
+Définition (Linéarité) #
 
 Une équation différentielle ordinaire d’ordre $n$ est dite linéaire si
 on peut l’écrire sous la forme
@@ -362,19 +386,29 @@ L’équation ci-dessus a les propriétés suivantes
 
 2. Les $y$ et toutes leur dérivées ont un degré polynomial de 1.
 
-#### Illustration {-}
+---
+
+Illustration #
 
 L’équation suivante est linéaire $$y''+4x\cdot y'=e^x.$$ 
 L’équation
 suivante n’est pas linéaire $$y\cdot y''+4x\cdot y'=e^x.$$
 
-#### Définition (Homogénéité) {-}
+---
+
+---
+
+Définition (Homogénéité) #
 
 Une équation différentielle ordinaire est dite homogène si le terme
 dépendant uniquement de $x$ est nul. Dans le cas où nous avons à faire à
 une équation différentielle linéaire, cela revient à dire que $b(x)=0$.
 
-#### Illustration (Homogénéité) {-}
+---
+
+---
+
+Illustration (Homogénéité) #
 
 Les équations suivantes sont homogènes $$\begin{aligned}
   &y''+4x\cdot y\cdot y'+3x^2\cdot y^3=0,\\
@@ -387,7 +421,9 @@ $$\begin{aligned}
 
 ---
 
-#### Exercice (Homogénéité) {-}
+---
+
+Exercice (Homogénéité) #
 
 Pour chacune de ces équations différentielles ordinaires 
 donner tous les qualificatifs possibles. Si l’équation est inhomogène
@@ -425,7 +461,7 @@ un certain nombre.
 
 ---
 
-#### Définition (Équations à variable séparables) {-}
+Définition (Équations à variable séparables) #
 
 On dit qu’une équation différentielle d’ordre 1 est à variables
 séparables, si elle peut s’écrire sous la forme suivante
@@ -435,7 +471,7 @@ $$y' a(y)=b(x).$$
 
 ---
 
-#### Illustration {-}
+Illustration #
 
 L’équation suivante est à variables séparables
 $$e^{x^2+y^2(x)}y'(x)=1.$$
@@ -455,11 +491,11 @@ $a(y)=1$ et il vient $$y=\int b(x){\mathrm{d}}x.$$
 
 ---
 
-#### Exemple {-}
+Exemple #
 
 Résoudre l’équation différentielle suivante $$n'(t)=r\cdot n(t).$$ 
 
-#### Solution {-}
+Solution #
 
 En
 écrivant $n'={\mathrm{d}}n /{\mathrm{d}}t$, on réécrit l’équation
@@ -474,7 +510,7 @@ n(t)&=e^{r\cdot t+C}=A\cdot e^{r\cdot t},\end{aligned}$$ où $A=e^C$.
 
 ---
 
-#### Exercice {-}
+Exercice #
 
 1. Résoudre l’équation différentielle suivante $$c'(t)=rc(t)+d.$$
 
@@ -526,12 +562,14 @@ Finalement, on a que la solution de l’équation générale de l’équation
 inhomogène est
 $$y=y_p+y_h=\left(\int \frac{b(x)}{e^{\int a(x){\mathrm{d}}x}}{\mathrm{d}}x+C\right)e^{\int a(x){\mathrm{d}}x}.$$
 
-#### Exemple {-}
+---
+
+Exemple #
 
 Résoudre l’équation suivante
 $$U_C'(t)+\frac{U_C(t)}{RC}=\frac{U}{RC}.$${#eq:rc_inhom} 
 
-#### Solution {-}
+Solution #
 
 On
 commence par résoudre l’équation homogène
@@ -546,14 +584,20 @@ $$U_c(t)=\left(U e^{\frac{1}{RC} t}+D+A\right)e^{-\frac{1}{RC}t}=U+(D+A)e^{-\fra
 où $C=D+A$. Pour le cas de la charge du condensateur, on a de plus
 $U_c(0)=0$. On peut donc fixer la constante $C=-U$.
 
+---
+
 Résoudre les équations différentielles suivantes
 
-#### Exercice {-}
+---
+
+Exercice #
 
 1. $$y'+2y=t^2$$
 
 2. $$y'+y=\frac{1}{1+e^t}.$$
 
+---
+
 ### Équations de Bernoulli
 
 Il existe des équations particulières qui peuvent se ramener à des
@@ -574,11 +618,11 @@ de la méthode de la section @sec:eq_lin.
 
 ---
 
-#### Exemple {-}
+Exemple #
 
 Résoudre l’équation de Bernoulli suivante $$y'-y-x\cdot y^6=0.$$ 
 
-#### Solution {-}
+Solution #
 
 Avec
 la substitution $z=y^5$, on obtient $$z'-5z+5x=0.$$ Cette équation se
@@ -614,7 +658,7 @@ la résoudre.
 
 --
 
-#### Exercice {-}
+Exercice #
 
 Résoudre l’équation de Riccati suivante $$y'+y^2-\frac{2}{x^2}=0.$$
 Indication: la solution particulière a la forme $y=\frac{a}{x}$, avec
@@ -660,7 +704,7 @@ l’équation différentielle.
 
 ---
 
-#### Propriétés {-}
+Propriétés #
 
 Ces propriétés (qui caractérisent le mot "linéaires") sont à démontrer en exercice.
 
diff --git a/05_fourier.md b/05_fourier.md
index 3eb3223da9b698dd735ab0769dc8e77ecea02e7c..acf52b784566b618c30fcc68abd6614ccccf6d0d 100644
--- a/05_fourier.md
+++ b/05_fourier.md
@@ -48,10 +48,14 @@ vérifier la commutativité $$\begin{aligned}
 (a,b)\cdot(c,d)&=(a\cdot c-b\cdot d,a\cdot d+b\cdot c)\nonumber\\
 &=(c\cdot a-d\cdot b,d\cdot a+c\cdot b)=(c,d)\cdot (a,b).\end{aligned}$$
 
-#### Exercice {-}
+---
+
+Exercice #
 
 Vérifier l’associativité du produit sur notre ensemble ${\real}^2$.
 
+---
+
 Regardons à présent ce qui se passe si on étudie les ensemble de
 nombres dans ${\real}^2$ où le deuxième nombre du couple est nul tels que $(a,0)$. Si on additionne
 deux tels nombres ont obtient $$(a,0)+(b,0)=(a+b,0).$$ On constate donc
@@ -186,7 +190,7 @@ $${\mathrm{Re}}(z)=\frac{1}{2}(z+{\bar{z}}),\quad {\mathrm{Im}}(z)=\frac{1}{2i}(
 
 ---
 
-#### Exercice {-}
+Exercice #
 
 Démontrer ces trois relations.
 
@@ -199,7 +203,7 @@ $$\begin{aligned}
 
 ---
 
-#### Exercice {-}
+Exercice #
 
 Démontrer ces relations.
 
@@ -213,7 +217,9 @@ allons considérer un ensemble $V$ muni d’une addition et d’une multiplicati
 à un ensemble $E$. Dans notre cas $E$
 sera ${\real}$ ou ${\mathbb{C}}$ (l'ensemble des nombres complexes)  principalement.
 
-#### Définition {-}
+---
+
+Définition #
 
 On appelle espace vectoriel sur $E$, un ensemble $V$, dont les éléments
 appelés vecteurs et notés $v$, sont sont munis des opérations 
@@ -244,8 +250,11 @@ propriétés suivantes
     3. La multiplication par un scalaire admet un élément neutre, noté
         $1$, pour la multiplication à gauche $$1 \cdot v=v.$$
 
+---
+
+---
 
-#### Exemple (Espaces vectoriels) {-}
+Illustration (Espaces vectoriels) #
 
 1. L’espace nul, $v=0$.
 
@@ -286,6 +295,8 @@ propriétés suivantes
        &f(\alpha \cdot x)=\alpha \cdot f(x),\quad \forall \alpha\in E,\ \mbox{et}\ x\in W.
       \end{aligned}$$
 
+---
+
 ### Base
 
 Nous avons introduit la notion très générale d’espace vectoriel et
@@ -321,7 +332,7 @@ $$w=u+v=u_1\cdot e_1+u_2\cdot e_2+v_1\cdot e_1+v_2\cdot e_2=(u_1+v_1)\cdot e_1+(
 
 ---
 
-#### Illustration  (Exemples de bases d'espaces vectoriels) {-}
+Illustration  (Exemples de bases d'espaces vectoriels) #
 
 1. Pour l’espace des fonctions polynomiales $f(x)=\sum_{i=0}^Na_ix^i$
     les fonction $e_i=x^i$ forment une base.
@@ -336,13 +347,19 @@ Plus formellement nous allons introduire un certain nombre de concepts
 mathématiques pour définir une base. Considérons toujours $V$ un espace
 vectoriel sur $E$.
 
-#### Définition (Famille libre) {-}
+---
+
+Définition (Famille libre) #
 
 Soient $\{\alpha_i\}_{i=1}^n\in E$. On dit qu’un ensemble de vecteurs
 $\{v_i\}_{i=1}^n\in V$ est une famille libre si
 $$\sum_{i=1}^n \alpha_iv_i=0 \Rightarrow \alpha_i=0,\ \forall i.$$
 
-#### Exemple (Famille libre) {-}
+---
+
+---
+
+Illustration (Famille libre) #
 
 1. $\{e_1\}$ est une famille libre de ${\real}^2$.
 
@@ -357,7 +374,11 @@ $$\sum_{i=1}^n \alpha_iv_i=0 \Rightarrow \alpha_i=0,\ \forall i.$$
     relie les deux. La relation est non-linéaire
     $\sin(x)=\sqrt{1-\cos^2(x)}$.
 
-#### Définition (Famille génératrice) {-}
+---
+
+---
+
+Définition (Famille génératrice) #
 
 On dit qu’un ensemble de vecteurs $\{e_i\}_{i=1}^n\in V$ est une famille
 génératrice si
@@ -365,7 +386,11 @@ $$\forall\ v\in V,\quad \exists \{\alpha_i\}_{i=1}^n\in E,\quad \mbox{t.q.}\quad
 En d’autres termes, tout $v\in V$ peut s’exprimer comme une combinaison
 linéaire des vecteur $e_i$.
 
-#### Illustration (Familles génératrices) {-}
+---
+
+---
+
+Illustration (Familles génératrices) #
 
 1. $\{e_1\}$ n’est pas une famille génératrice de ${\real}^2$. On ne
     peut pas représenter  les vecteurs de la forme $v=(0,v_2)$,
@@ -376,7 +401,11 @@ linéaire des vecteur $e_i$.
 3. $\{e_1,e_2,v\}$, avec $v=(1,1)$ est une famille génératrice de
     ${\real}^2$.
 
-#### Définition (Base) {-}
+---
+
+---
+
+Définition (Base) #
 
 Un ensemble de vecteurs $B=\{e_i\}_{i=1}^n$ forme une base si c’est une
 famille génératrice et une famille libre. En d’autres termes cela
@@ -386,7 +415,11 @@ est unique
 $$\forall v\in V, \quad !\exists \{\alpha_i\}_{i=1}^n\in E,\quad t.q.\quad v=\sum_{i=1}^n\alpha_i v_i.$$
 Les $\alpha_i$ sont appelé les coordonnées de $v$ dans la base $B$.
 
-#### Illustration (Base de $\real ^2$) {-}
+---
+
+---
+
+Illustration (Base de $\real ^2$) #
 
 1. $\{e_1,e_2\}$ est une base de ${\real}^2$.
 
@@ -396,6 +429,8 @@ Les $\alpha_i$ sont appelé les coordonnées de $v$ dans la base $B$.
     coordonnées $\alpha=(0,0,0)$ et également les coordonnées
     $\beta=(1,1,-1)$.
 
+---
+
 ## Introduction générale sur les séries de Fourier
 
 Dans cette sous section, nous allons voir de façon très générale les
@@ -613,7 +648,7 @@ pouvoir calculer sa transformée de Fourier:
 
 ---
 
-#### Exercice {-}
+Exercice #
 
 Calculer les transformées de Fourier des fonctions suivantes
 
@@ -634,7 +669,7 @@ Calculer les transformées de Fourier des fonctions suivantes
 
 ---
 
-#### Exercice {-}
+Exercice #
 
 Calculer les transformées de Fourier inverse de la fonction suivante
 
@@ -649,7 +684,9 @@ Calculer les transformées de Fourier inverse de la fonction suivante
 
 La transformée de Fourier possède plusieurs propriétés intéressantes.
 
-#### Propriété {-}
+---
+
+Propriété #
 
 1. Linéarité. Soit une fonction $h(t)=af(t)+bg(t)$, alors sa
     transformée de Fourier est donnée par
@@ -674,6 +711,8 @@ La transformée de Fourier possède plusieurs propriétés intéressantes.
     paire (impaire), alors ${\hat{f}}(\omega)$ sera une fonction paire
     (impaire).
 
+---
+
 La transformée de Fourier à temps discret (TFTD)
 ------------------------------------------------
 
@@ -708,8 +747,9 @@ l’intégrale et on a $$\begin{aligned}
      &=\frac{1}{2\pi}\left(\sum_{m=-\infty}^\infty f[m] \delta_{mn} 2\pi\right),\nonumber\\
      &=f[n].\nonumber\end{aligned}$$
 
+---
 
-#### Exercice  {-}
+Exercice  #
 
 Calculer les transformées de Fourier (inverses quand c’est approprié) en
 temps discret des fonctions suivantes
@@ -724,6 +764,8 @@ temps discret des fonctions suivantes
                     0,&\mbox{ sinon.}
                    \end{array}\right.$$
 
+---
+
 Il est intéressant de noter qu’on peut représenter une suite discrète et
 infinie de points par une fonction continue et périodique.
 
@@ -876,7 +918,7 @@ période $N$ $${\hat{f}}[k]={\hat{f}}[k+N].$$
 
 ---
 
-#### Exercice {-}
+Exercice #
 
 A démontrer en exercice.
 
diff --git a/06_probas_stats.md b/06_probas_stats.md
index 4401c7a0f10f042196313a9861b396256a700c69..37ea415bde9ad9739951a60064f9366b8480a3e3 100644
--- a/06_probas_stats.md
+++ b/06_probas_stats.md
@@ -39,7 +39,7 @@ l’ensemble des valeurs possibles pour le dit caractère.
 
 ---
 
-#### Illustration {-}
+Illustration #
 
 1. Cas discret: On étudie la distribution de salaires annuels dans une
     entreprise. Les salaires possibles sont $40'000$, $50'000$, $60'000$
@@ -96,14 +96,12 @@ et du benchmark de l’application (voir Tabl. @tbl:exec)
 Sous forme de graphique on peut représenter le tableau des salaires sous
 la forme d’un graphique bâton (voir Fig. @fig:salaires)
 
-![Nombre salariés en fonction du
-salaire.](figs/graph_salaires.svg){#fig:salaires width="50.00000%"}
+![Nombre salariés en fonction du salaire.](figs/graph_salaires.svg){#fig:salaires width="50.00000%"}
 
 ou d’un histogramme pour le temps d’exécution de l’application (voir
 Fig. @fig:exec).
 
-![Nombre d’exécutions en fonction du temps
-d’exécution.](figs/graph_exec.svg){#fig:exec width="50.00000%"}
+![Nombre d’exécutions en fonction du temps d’exécution.](figs/graph_exec.svg){#fig:exec width="50.00000%"}
 
 ### Fréquences
 
@@ -120,7 +118,7 @@ $$f_i=\frac{n_i}{n}.$$
 
 ---
 
-#### Exemple (Fréquences) {-}
+Illustration (Fréquences) #
 
 Les tableaux de fréquence des deux exemples précédents sont donnés par
 
@@ -155,7 +153,7 @@ retrouverons dans les sections suivantes qui sont assez intuitives
 
 ---
 
-#### Propriété (Propriétés de la fréquence) {-}
+Propriété (Propriétés de la fréquence) #
 
 1. Les fréquences sont toujours dans l’intervalle $[0,1]$
     $$0\leq f_i\leq 1.$$
@@ -190,7 +188,9 @@ tableaux @tbl:salaires et @tbl:exec (voir le
 
   : Tableau des temps d'exécution et la fréquence et fréquences cumulées des temps d'exécution. {#tbl:exec_freqcum}
 
-#### Exercice (Fréquence cumulée) {-}
+---
+
+Exercice (Fréquence cumulée) #
 
 1. Tracer les graphes de la fréquence cumulée pour les deux exemples
     que nous avons vus.
@@ -198,6 +198,8 @@ tableaux @tbl:salaires et @tbl:exec (voir le
 2. Que pouvons-nous déduire de la forme de la fonction (croissance,
     valeur maximale)?
 
+---
+
 ### Mesures de tendance centrale
 
 Jusqu’ici le nombre de valeurs étudiées était limité et il est assez
@@ -214,7 +216,7 @@ $$\bar{x}=\sum_{i=0}^{k-1}f_i\cdot x_i.$$
 
 ---
 
-#### Exercice (Propriétés de la moyenne) {-}
+Exercice (Propriétés de la moyenne) #
 
 1. Démontrer la relation précédente.
 
@@ -224,7 +226,7 @@ $$\bar{x}=\sum_{i=0}^{k-1}f_i\cdot x_i.$$
 
 ---
 
-#### Illustration (Moyenne) {-}
+Illustration (Moyenne) #
 
 Pour l’exemple des salaires la moyenne est donnée par
 $$\bar{x}_{\textrm{salaire}}=\frac{35\cdot40000+20\cdot50000+5\cdot60000+1\cdot1000000}{61}=60656.$$
@@ -252,12 +254,16 @@ le reste est telle que $x_i\geq\tilde{x}$.
 Pour l’exemple des salaires le salaire médian est de $40000 CHF$, ce qui
 reflète beaucoup mieux la distribution des salaire de notre population.
 
-#### Exercice (Moyenne, médiane) {-}
+---
+
+Exercice (Moyenne, médiane) #
 
 Calculer la moyenne et la médiane pour l’exemple du temps d’exécution
 (prendre la borne inférieure des intervalles pour chaque temps
 d’exécution[^7]).
 
+---
+
 ### Mesures de dispersion
 
 Nous avons vu deux mesures donnant une tendance générale des caractères
@@ -282,7 +288,7 @@ $$s=\sqrt{v}.$$
 
 ---
 
-#### Exercice (Variance, écart-type) {-}
+Exercice (Variance, écart-type) #
 
 Démontrer les relations suivantes
 
@@ -303,7 +309,7 @@ $$s=\sqrt{v}=121440.$$
 
 ---
 
-#### Exercice (Variance, écart-type) {-}
+Exercice (Variance, écart-type) #
 
 Calculer la variance et l’écart type à partir des valeurs du benchmark
 de l’application.
@@ -331,7 +337,7 @@ semi-inter-quartile.
 
 ---
 
-#### Exercice (Semi-inter quartile) {-}
+Exercice (Semi-inter quartile) #
 
 Calculer les intervalles semi-inter-quartiles des exemples que nous
 avons vus plus tôt dans le cours.
@@ -351,7 +357,7 @@ sera utile pour la suite.
 
 ---
 
-#### Définition {-}
+Définition #
 
 - L’ensemble des résultats possibles du lancer de dé est
     $\Omega=\{1,2,3,4,5,6\}$ et cet ensemble est appelé l’*univers* du
@@ -505,7 +511,7 @@ comme la conséquences des trois axiomes des probabilités suivants
 
 ---
 
-#### Définition (Axiomes des probabilités) {-}
+Définition (Axiomes des probabilités) #
 
 Soit $\Omega$ un univers. La probabilité de
 réaliser un événement $A\subseteq\Omega$ est une fonction $p(A)$ qui
@@ -527,7 +533,7 @@ De ces axiomes découlent tout un tas de théorèmes
 
 ---
 
-#### Théorème {-}
+Théorème #
 
 Pour $A,B\subseteq\Omega$ et $\Omega$ un univers et $p$ une probabilité.
 
@@ -583,7 +589,7 @@ $p(A|B)$, tel que $$p(A|B)=\frac{p(A\cap B)}{p(B)}.$$
 
 ---
 
-#### Exercice (Probabilités conditionnelles) {-}
+Exercice (Probabilités conditionnelles) #
 
 Sur une population de 1000 hommes qui naissent, 922 atteignent l’âge de
 50 ans et 665 l’âge de 70 ans.
@@ -626,7 +632,7 @@ résultat de celui de la semaine suivante.
 
 ---
 
-#### Exercice (Événements indépendants)  {-}
+Exercice (Événements indépendants)  #
 
 On jette une pièce de monnaie deux fois de
 suite. Les résultats possible pour chaque jet sont: $P$, ou $F$.
@@ -668,8 +674,7 @@ $$p(A)=\frac{1}{36}.$$ Une autre façon de visualiser ce genre de
 réalisation est de l’écrire sous forme d’arbre (voir la figure
 @fig:arbre).
 
-![Représentation du tirage $26$ sous forme
-d’arbre.](figs/arbre.svg){#fig:arbre width="\textwidth"}
+![Représentation du tirage $26$ sous forme d’arbre.](figs/arbre.svg){#fig:arbre width="\textwidth"}
 
 Comme pour le cas à un tirage, tout tirage successif de dés est
 équiprobable et la probabilité de chaque tirage est de $1/36$.
@@ -681,8 +686,7 @@ probabilité de cet enchaînement est obtenu en multipliant les événements
 élémentaires
 $$p(\{26\})=p(\{2\})\cdot p(\{6\})=\frac{1}{6}\cdot\frac{1}{6}.$$
 
-![Représentation du tirage $26$ sous forme d’arbre avec les probabilités
-associées.](figs/arbre2.svg){#fig:arbre2 width="\textwidth"}
+![Représentation du tirage $26$ sous forme d’arbre avec les probabilités associées.](figs/arbre2.svg){#fig:arbre2 width="\textwidth"}
 
 Afin de calculer la probabilité du tirage $26$ il suffit de suivre le
 chemin menant de la racine à la feuille correspondante et de multiplier
@@ -703,11 +707,7 @@ aussi utiliser la représentation sous forme d’arbre où on somme
 simplement les probabilités de chacun des éléments de $A$ (voir figure
 @fig:arbre3).
 
-![Représentation de l’événement $A=\{22,24,26,42,44,46\}$ sous forme
-d’arbre avec les probabilités associées. Toutes les probabilités et
-tirages possibles associés aux branches ne sont pas affichées pour
-simplifier
-l’affichage.](figs/arbre3.svg){#fig:arbre3 width="\textwidth"}
+![Représentation de l’événement $A=\{22,24,26,42,44,46\}$ sous forme d’arbre avec les probabilités associées. Toutes les probabilités et tirages possibles associés aux branches ne sont pas affichées pour simplifier l’affichage.](figs/arbre3.svg){#fig:arbre3 width="\textwidth"}
 
 Comme vu dans la section @sec:disjoints, il suffit de prendre la
 somme des probabilités des événements élémentaires $$\begin{aligned}
@@ -731,7 +731,7 @@ $1/6$. On a donc que $$p(A)=\frac{1}{3}\cdot \frac{1}{6}=\frac{1}{18}.$$
 
 ---
 
-#### Exercice {-}
+Exercice #
 
 1. Calculer la probabilité d’obtenir $2$ comme la somme des deux
     nombres tirés par deux dés.
@@ -803,7 +803,7 @@ $$p([n_1,...,n_k])=\frac{n!}{n_1!\cdots n_k!}p_1^{n_1}\cdots p_k^{n_k}.$$
 
 ---
 
-#### Exercice {-}
+Exercice #
 
 On lance un dé parfait 10 fois. Quelle est la probabilité d’obtenir:
 
@@ -832,29 +832,25 @@ Afin de calculer cette probabilité le fait qu’on effectue un tirage avec
 remise est primordial. En effet considérons le cas initial illustré dans
 la @fig:loto.
 
-![Les six numéros présents initialement dans le
-sac.](figs/loto.svg){#fig:loto height="1.8truecm"}
+![Les six numéros présents initialement dans le sac.](figs/loto.svg){#fig:loto height="1.8truecm"}
 
 Pendant le premier tirage, nous tirons le numéro 2 (voir figure
 @fig:loto2). Notons que le tirage du 2 a une probabilité
 $\frac{1}{6}$.
 
-![Le numéro 2 est tiré lors du premier
-tirage.](figs/loto2.svg){#fig:loto2 height="1.8truecm"}
+![Le numéro 2 est tiré lors du premier tirage.](figs/loto2.svg){#fig:loto2 height="1.8truecm"}
 
 Il est donc enlevé du sac et il nous reste uniquement 5 chiffres parmi
 lesquels choisir (les chiffres $1$, $3$, $4$, $5$, et $6$, comme dans la
 @fig:loto3).
 
-![Il ne reste que 5 chiffres dans le
-sac.](figs/loto3.svg){#fig:loto3 height="1.8truecm"}
+![Il ne reste que 5 chiffres dans le sac.](figs/loto3.svg){#fig:loto3 height="1.8truecm"}
 
 Comme il ne nous reste que 5 chiffres, la probabilité de tirer un des
 nombres restant, disons le $5$, est de $\frac{1}{5}$ (voir la figure
 @fig:loto4).
 
-![Il ne reste que 5 chiffres dans le sac et nous tirons le
-5.](figs/loto4.svg){#fig:loto4 height="1.8truecm"}
+![Il ne reste que 5 chiffres dans le sac et nous tirons le 5.](figs/loto4.svg){#fig:loto4 height="1.8truecm"}
 
 Le 5 sera lui aussi retiré et il ne restera que 4 numéros dans le sac et
 ainsi de suite.
@@ -872,7 +868,7 @@ $p(\{5,2\}\backslash \{2\mbox{ ou }5)=\frac{1}{5}$ pour trouver la probabilité
 
 ---
 
-#### Exercice {-}
+Exercice #
 
 1. Le jeu Euromillions consiste en un tirage de 5 numéros parmi 50
     possible, puis par le tirage de 2 “étoiles” parmi 11 possibles.
@@ -1002,7 +998,7 @@ On peut noter dans le cas général qu’on a $D=X^{-1}(I)$.
 
 ---
 
-#### Définition (Variable aléatoire) {-}
+Définition (Variable aléatoire) #
 
 On dit que la fonction $X:\Omega\rightarrow{\real}$ est une
 *variable aléatoire* si la préimage de $X$ sur tout intervalle,
@@ -1014,7 +1010,7 @@ probabilité de réaliser l’événement $A$ $$p(X\in I)=p(A).$$
 
 ---
 
-#### Définition (Fonction de répartition) {-}
+Définition (Fonction de répartition) #
 
 On dit que la fonction $F:{\real}\rightarrow{\real}$ est une
 *fonction de répartition* si $F(x)=p(X\leq x)$ pour tout
diff --git a/Makefile b/Makefile
index ff4d473331d9a4eaaac3d654e5263ce08d578954..30f39507dd1de40d8328e412a88041eebbd9c13f 100644
--- a/Makefile
+++ b/Makefile
@@ -4,6 +4,7 @@ STYLES := css/tufte-css/tufte.css \
 	css/tufte-extra.css
 
 OPTIONS = --toc
+OPTIONS += --filter=pandoc-numbering
 OPTIONS += --filter=pandoc-crossref
 
 PDFOPTIONS = --highlight-style kate