Introduction

On retrouve la statistique bayésienne un peu partout en sciences. Par exemple, en épidémiologie pour prédire la circulation des virus, en écologie pour expliquer l’extinction des espèces végétales et animales ou encore en informatique pour filtrer les courriels nuisibles. Si l’utilisation de la statistique bayésienne a explosé au cours des dernières années, c’est grâce au progrès de nos ordinateurs. C’est aussi grâce à la nature même de l’approche qui permet de coller à notre façon d’apprendre, de raisonner et d’accumuler des connaissances.

Dans ce livre, je vous propose une introduction à la statistique bayésienne. Ce livre est en français parce que c’est plus facile à écrire pour moi, et parce que j’aurais aimé avoir plus d’ouvrages dans ma langue maternelle lorsque j’étais étudiant.

Je me suis fixé comme objectifs de i) synthétiser les aspects méthodologiques à bien comprendre et ii) fournir les moyens pratiques pour utiliser vous-mêmes la statistique bayésienne. Parce qu’on comprend mieux en faisant, nous utiliserons un logiciel pour pratiquer la statistique bayésienne. Ce logiciel c’est R, un logiciel libre pour faire des statistiques et de la science des données. En français, je recommande l’excellent manuel de Julien Barnier, Introduction à R et au tidyverse disponible en ligne via https://juba.github.io/tidyverse et le site du projet collaboratif Analyse-R, disponible aussi en ligne à https://larmarange.github.io/analyse-R/. Pour la statistique bayésienne en particulier, je présente deux solutions pour mettre en oeuvre la statistique bayésienne en pratique : brms, qui propose une syntaxe simple et familière, proche de celle utilisée pour les régressions dans R ; NIMBLE, qui nécessite de programmer (écrire des boucles par exemple), mais offre en contrepartie une grande flexibilité.

Plutôt que dans un style académique, j’ai choisi d’écrire un peu comme si nous étions ensemble dans la même pièce ou en visio-conférence, et que je devais vous expliquer de vive voix la statistique bayésienne. Ainsi, je ferai parfois (souvent en fait) des abus de langage et des approximations mathématiques. Vous ne m’en voudrez pas j’espère.

Pourquoi s’intéresser à la statistique bayésienne ?

La statistique bayésienne est une approche pour analyser les données et prendre des décisions en présence d’incertitude, comme lorsqu’on lance un dé ou qu’on prévoit la météo : on ne peut pas savoir exactement ce qui va se passer, mais on peut estimer les chances des différents résultats. Pourquoi adopter cette approche ? Plusieurs raisons peuvent motiver son utilisation :

  • une interprétation naturelle des probabilités : en statistique bayésienne, une probabilité représente un degré de confiance dans une hypothèse ou un paramètre, ce qui correspond bien à notre manière intuitive de raisonner face à l’incertitude ;
  • une grande flexibilité : le cadre bayésien s’adapte bien à des données incomplètes, hétérogènes ou rares, ainsi qu’à des modèles complexes (hiérarchiques, non linéaires, dynamiques, etc.) ;
  • la possibilité d’intégrer des connaissances préalables : on peut capitaliser sur des résultats d’études précédentes ou des avis d’expert.e.s de manière transparente et formalisée ;
  • une gestion rigoureuse de l’incertitude : la statistique bayésienne fournit non seulement une estimation des paramètres, mais aussi une mesure directe de l’incertitude associée.

Ce que nous allons voir dans ce livre

J’aimerais vous guider dans l’apprentissage de la statistique bayésienne. J’ai rassemblé le matériel qui m’a paru essentiel pour la comprendre et l’appliquer. L’objectif est que vous soyez à l’aise avec l’approche bayésienne et que vous puissiez l’appliquer à vos propres données. Les objectifs sont de :

  • démystifier la statistique bayésienne et les méthodes de Monte Carlo par chaînes de Markov (MCMC) ;
  • comprendre les différences entre approche bayésienne et approche fréquentiste ;
  • lire et comprendre les sections “méthodes” des articles scientifiques utilisant l’approche bayésienne ;
  • savoir mettre en oeuvre vos analyses avec la statistique bayésienne dans R.

Le Chapitre 1 pose les bases en revenant sur quelques rappels de probabilité utiles pour la suite. Ce sera aussi l’occasion d’introduire les notions clés de la statistique bayésienne, à travers un exemple simple qui permettra de fixer les idées.

Dans le Chapitre 2, nous passerons dans les coulisses de la statistique bayésienne, avec les méthodes de Monte Carlo par chaînes de Markov (MCMC), qui rendent l’inférence possible en pratique. On mettra un peu la main à la pâte en codant nous-mêmes une analyse bayésienne.

Le Chapitre 3 présentera deux outils très utiles pour faire de la statistique bayésienne sans trop d’efforts : NIMBLE et brms. Grâce à ces outils, plus besoin de tout faire soi-même.

Le Chapitre 4 sera consacré aux distributions a priori. On verra comment bien les choisir, comment traduire de l’information existante sous forme de prior, et les pièges à éviter.

Dans le Chapitre 5, nous verrons comment faire une régression linéaire en statistique bayésienne. Nous en profiterons pour illustrer la comparaison et la validation des modèles. Nous utiliserons NIMBLE et brms et comparerons à l’approche fréquentiste.

Le Chapitre 6 nous emmènera vers les modèles linéaires généralisés, avec ou sans effets aléatoires - des modèles très utilisés en pratique. On s’appuiera sur la simulation de données, un outil précieux pour bien comprendre ce que fait un modèle. Je vous montrerai comment faire ces analyses avec NIMBLE et brms et on comparera à l’analyse fréquentiste.

Enfin, un dernier chapitre viendra résumer les messages clés du livre et proposer quelques conseils pour appliquer la statistique bayésienne.

Comment lire ce livre?

Je n’ai pas vraiment de conseil à vous donner sur la meilleure manière de lire ce livre. Personnellement, je trouve toujours difficile d’absorber toute l’information contenue dans un bouquin. Vous pouvez lire en continu ou bien grapiller des éléments de-ci de-là.

Le code R est fourni, je l’ai hébergé sur https://github.com/oliviergimenez/statistique-bayes et le mettrai à jour. S’exercer permet de mieux comprendre, et de vérifier qu’on a bien compris. Si vous lisez la version électronique disponible à https://oliviergimenez.github.io/statistique-bayes, vous pouvez copier les lignes de code puis les coller dans R pour les exécuter. Pour gagner un peu de place, et éviter de perturber trop la lecture, certains codes ne sont pas donnés, en particulier ceux qui permettent de produire les figures, mais ils sont disponibles à https://github.com/oliviergimenez/statistique-bayes.

Si vous voulez aller plus loin, je conseille les ouvrages suivants dont la liste n’est bien sûr pas exhaustive. Ces ouvrages ont été une source d’inspiration dans la rédaction de ce livre. J’ai hésité à donner plus de références, et à citer (beaucoup) d’articles scientifiques, mais je ne le ferai pas, les ouvrages ci-dessous sont largement suffisants.

  • Initiation à la Statistique Bayésienne - Bases Théoriques et Applications en Alimentation, Environnement, Epidémiologie et Génétique (BIOBAYES 2015). Si vous cherchez une première approche en français, claire et illustrée par des exemples concrets, ce livre est une très bonne porte d’entrée. Tout est là https://biobayes.mathnum.inrae.fr/ouvrage.

  • Bayesian Methods for Ecology (McCarthy 2007). Un petit livre vraiment accessible pour comprendre comment appliquer la statistique bayésienne en écologie, sans se noyer dans les maths. Le site du livre est ici https://bit.ly/4jSlfQL.

  • Applied Statistical Modelling for Ecologists: A Practical Guide to Bayesian and Likelihood Inference Using R, JAGS, NIMBLE, Stan and TMB (Kéry and Kellner 2010). Un manuel pratique pour apprendre à modéliser avec les principaux outils bayésiens dans R (JAGS, NIMBLE, Stan ou TMB), à partir d’exemples écologiques concrets et de comparaisons des résultats. Le site du livre avec les codes est ici https://www.elsevier.com/books-and-journals/book-companion/9780443137150.

  • Bayes Rules!: An Introduction to Applied Bayesian Modeling (Johnson, Ott, and Dogucu 2022). Un livre très pédagogique pour découvrir les principes et les applications de la statistique bayésienne de manière intuitive et progressive. Le livre est disponible en ligne là https://www.bayesrulesbook.com/.

  • Doing Bayesian Data Analysis: A Tutorial with R and Bugs (Kruschke 2010). Un tutoriel approfondi et visuel qui accompagne pas à pas l’apprentissage de la statistique bayésienne avec de nombreux exemples pratiques. Tout est là https://sites.google.com/site/doingbayesiandataanalysis/.

  • Bayesian Data Analysis (A. Gelman et al. 2013). L’ouvrage de référence pour celles et ceux qui souhaitent acquérir une compréhension théorique et appliquée solide de la statistique bayésienne. Le site du livre est ici https://sites.stat.columbia.edu/gelman/book/.

  • Statistical Rethinking: A Bayesian Course with Examples in R and Stan (McElreath 2020). Un livre captivant pour apprendre à construire et interpréter des modèles bayésiens en développant d’abord l’intuition statistique. Tous les détails ici https://xcelab.net/rm/, je recommande chaudement le cours en vidéos là https://github.com/rmcelreath/stat_rethinking_2024.

Comment j’ai écrit ce livre?

J’ai écrit ce livre avec RStudio (http://www.rstudio.com/ide/) en utilisant le package bookdown (http://bookdown.org/). Le site web est hébergé via des GitHub Pages (https://pages.github.com/).

J’ai utilisé la version R-4.5.0_2025-04-11 de R et les packages suivants :

package version source
bookdown 0.43 CRAN (R 4.5.0)
brms 2.22.0 CRAN (R 4.5.0)
lme4 1.1-37 CRAN (R 4.5.0)
MCMCvis 0.16.3 CRAN (R 4.5.0)
nimble 1.3.0 CRAN (R 4.5.0)
posterior 1.6.1 CRAN (R 4.5.0)
tidyverse 2.0.0 CRAN (R 4.5.0)
visreg 2.7.0 CRAN (R 4.5.0)

A propos de l’auteur

Je m’appelle Olivier Gimenez (https://oliviergimenez.github.io/). Je suis directeur de recherche au CNRS. Après des études universitaires en mathématiques, j’ai fait une thèse en statistique pour l’écologie. J’ai passé mon habilitation à diriger des recherches (HdR) en écologie et évolution. Je suis aussi retourné sur les bancs de l’université pour m’initier à la sociologie.

J’ai écrit des articles scientifiques (https://oliviergimenez.github.io/publication/papers/) faisant appel à la statistique bayésienne, et co-écrit avec des collègues des ouvrages (https://oliviergimenez.github.io/publication/books/) dont plusieurs abordent la statistique bayésienne.

Vous pouvez me retrouver sur BlueSky (oaggimenez.bsky.social) et LinkedIn (olivier-gimenez-545451115/), ou bien me contacter via mon adresse email qui s’écrit olivier suivi d’un point puis gimenez, ensuite arobase, puis cefe, suivi d’un point, puis cnrs, suivi d’un point et pour terminer fr.

Remerciements

Merci à mon employeur, le Centre National de la Recherche Scientifique (CNRS). Chercheur.e et enseignant.e-chercheur.e sont des beaux métiers. Des métiers utiles. On assiste néanmoins à la dégradation des conditions de travail dans le monde académique. Plus de compétition, plus de précarité, moins de postes pérennes. J’ai la chance d’évoluer dans un environnement bienveillant, le Centre d’Ecologie Fonctionnelle et Evolutive (CEFE), dont les personnels résistent en cultivant le collectif et les collaborations. Merci à eux.

Mon intérêt pour la statistique bayésienne remonte à mes années en Angleterre et en Ecosse pour un post-doctorat. Merci à Byron Morgan de m’avoir laissé la liberté d’explorer cette voie qui n’était pas encore à la mode. Merci à Ruth King pour nos échanges et ma première expérience d’écriture d’un livre, et à Steve Brooks pour les séances de remue-méninge. C’est avec Byron, Ruth et Steve que nous avons organisé les premières formations (ou workshops) à la statistique bayésienne pour l’écologie. Je remercie également les collègues pour le matériel qu’ils ont mis à disposition et dont je me suis inspiré pour écrire ce livre.

Je remercie les étudiant.e.s de Master qui subissent mon enseignement depuis plus de 10 ans. Ils ont été mes cobayes et m’ont permis de mûrir (inconsciemment) ce projet de livre. Merci aussi aux étudiant.e.s de Master, aux doctorant.e.s et aux post-doctorant.e.s qui ont partagé un bout de vie avec moi.

Merci aux personnes qui ont bien voulu relire des parties de ce livre.

Et parce que je ne suis pas grand chose sans eux, ce livre est dédié à Eleni, Gabriel et Mélina.