Vous trouverez ci-dessous mes recommandations sur quelques ressources statistiques.
Vous voulez en savoir plus sur une ressource?
Vous souhaitez être accompagné pour maîtriser les ressources présentées plus rapidement?
Votre livre ou logiciel préféré sur les statistiques bayésiennes, la causalité ou les statistiques en général ne s’y trouve pas?

The « Book of Why » par Judea Pearl est une superbe introduction à la causalité. Il explore l’historique menant aux développements de la nouvelle science des causes et des effets. Et malgré ses presques dix ans, il explore déjà la relation entre causalité et intelligence artificielle.

La bible que tous bons bayésien devrait avoir chez lui 🙂 Plus sérieusement, Ce livre est très expliqué et illustré et permet un passage sans traumatisme (ou presque) des statistiques fréquentistes aux statistiques bayésiennes, avec des exemples de reproductions d’analyses fréquentistes.
Un language pour les gouverner tous… Je n’en citerai donc qu’un seul:

Les meilleures packages python au delà des classiques (pandas, numpy…):
- Traitement de données
- pyjanitor: pour nettoyer les données
- polars: un pandas plus robuste pour le big data
- skimpy: un pandas.describe() sous stéroïde
- DataVis
- seaborn: de très beaux graphiques en très peu de lignes de code
- Causalité
- DoWhy: pour l’estimation d’effet causaux
- Causal-learn: pour la découverte causale
- CausalPy: pour l’inférence causale Bayesienne
- EconML: pour l’IA causale
- Statistiques Bayésiennes
- Bambi: construire rapidemment des modèles mixtes linéaires bayésien
- PyMC: la base pour faire de la modélisation bayésienne et un peu de causalité
- Arviz: l’indispensable au côté de pymc pour les visualisations
- PyMC-marketing: pour des modèles mixtes marketing en bayésien
- ML, IA et LLMs
- scikit-learn/pytorch/tensorflow: pour l’intelligence artificielle
- LangChain/LangGraph: pour les LLMs

JASP est un logiciel point-and-click très adapté au étudiant-e-s ou pour faire des testes rapides. Il inclus les méthodes fréquentistes et bayésiennes, ce qui est utile pour faire des comparaisons. De plus, il dispose de plusieurs plugin pour explorer divers domaines ou apprendre. Il est libre d’accès
- https://statmodeling.stat.columbia.edu: Blog de Andrew Gelman, Professeur de statistiques et de sciences politiques à l’université Columbia, il a notamment co-créé (avec Bob Carpenter) Stan qui est une très célèbre librairie permettant de faire de la modélisation bayésienne en R et Python. Ce blog ce concentre sur les statistiques bayésienne et la causalité
- https://www.youtube.com/@rmcelreath (en Anglais): Professeur d’anthropologie, Richard McElreath donne un cours en libre accès que j’ai particulièrement apprécié sur la modélisation causale en utilisant des techniques bayésiennes avancées. Je vous recommande un binge watching avec plus de 26h de cours 😉
- https://www.youtube.com/c/3blue1brown (en Anglais): pas seulement de la statistiques, mais principalement des maths avec de magnifiques animations 3D


