Vous trouverez ci-dessous mes recommandations sur quelques ressources statistiques.

Vous voulez en savoir plus sur une ressource?

Vous souhaitez être accompagné pour maîtriser les ressources présentées plus rapidement?

Votre livre ou logiciel préféré sur les statistiques bayésiennes, la causalité ou les statistiques en général ne s’y trouve pas?

The « Book of Why » par Judea Pearl est une superbe introduction à la causalité. Il explore l’historique menant aux développements de la nouvelle science des causes et des effets. Et malgré ses presques dix ans, il explore déjà la relation entre causalité et intelligence artificielle.

La bible que tous bons bayésien devrait avoir chez lui 🙂 Plus sérieusement, Ce livre est très expliqué et illustré et permet un passage sans traumatisme (ou presque) des statistiques fréquentistes aux statistiques bayésiennes, avec des exemples de reproductions d’analyses fréquentistes.

Un language pour les gouverner tous… Je n’en citerai donc qu’un seul:

Les meilleures packages python au delà des classiques (pandas, numpy…):

  • Traitement de données
    • pyjanitor: pour nettoyer les données
    • polars: un pandas plus robuste pour le big data
    • skimpy: un pandas.describe() sous stéroïde
  • DataVis
    • seaborn: de très beaux graphiques en très peu de lignes de code
  • Causalité
    • DoWhy: pour l’estimation d’effet causaux
    • Causal-learn: pour la découverte causale
    • CausalPy: pour l’inférence causale Bayesienne
    • EconML: pour l’IA causale
  • Statistiques Bayésiennes
    • Bambi: construire rapidemment des modèles mixtes linéaires bayésien
    • PyMC: la base pour faire de la modélisation bayésienne et un peu de causalité
    • Arviz: l’indispensable au côté de pymc pour les visualisations
    • PyMC-marketing: pour des modèles mixtes marketing en bayésien
  • ML, IA et LLMs
    • scikit-learn/pytorch/tensorflow: pour l’intelligence artificielle
    • LangChain/LangGraph: pour les LLMs

Il faut tout de même que j’en parle, car python n’est pas bon partout je dois l’admettre…

Pour la production, j’utiliserais du Rust quand cela est possible, afin d’avoir de bonnes performances et une bonne sécurité

JASP est un logiciel point-and-click très adapté au étudiant-e-s ou pour faire des testes rapides. Il inclus les méthodes fréquentistes et bayésiennes, ce qui est utile pour faire des comparaisons. De plus, il dispose de plusieurs plugin pour explorer divers domaines ou apprendre. Il est libre d’accès

G*Power est le logiciel complet pour effectuer de l’estimation de taille d’échantillon. Il est libre d’accès et très puissant