Garden of KnowledgeApplied Sciences › Computer Science › Software › Data Science
February 12, 2026

Les bases de la Data Science

La Data Science combine statistiques, informatique et expertise métier pour extraire des connaissances à partir de données.

graph TB
    DS["Data Science"]
    DS --> STAT["Statistiques<br/>& Mathématiques"]
    DS --> CS["Informatique<br/>& Programmation"]
    DS --> DOMAIN["Expertise<br/>Métier"]

    style DS fill:#673AB7,color:#fff
    style STAT fill:#2196F3,color:#fff
    style CS fill:#4CAF50,color:#fff
    style DOMAIN fill:#FF9800,color:#fff

Types d’apprentissage§

graph TB
    ML["Machine Learning"] --> SUP["Supervisé<br/>On connaît la réponse"]
    ML --> NSUP["Non Supervisé<br/>On ne connaît pas la réponse"]
    ML --> RL["Renforcement<br/>Apprentissage par essai/erreur"]

    SUP --> CLASS["Classification"]
    SUP --> REG["Régression"]
    NSUP --> CLUST["Clustering"]
    NSUP --> DIM["Réduction de dimension"]

    style ML fill:#673AB7,color:#fff
    style SUP fill:#2196F3,color:#fff
    style NSUP fill:#4CAF50,color:#fff
    style RL fill:#FF9800,color:#fff
SuperviséNon-Supervisé
Données étiquetées (on connaît y)Données non étiquetées (pas de y)
Apprend à prédireApprend à structurer
K-NN, SVM, CART, Random Forest, Régression Linéaire, LDA, Naive BayesK-means, CAH, DBSCAN, PCA

Statistiques vs Data Mining§

StatistiquesData Mining
Peu de donnéesMillions de données
Quelques paramètresBeaucoup de paramètres
Modèles interprétablesModèles prédictifs (boîte noire possible)
Hypothèses sur les donnéesLaisse les données “parler”

Normalisation§

But : éviter que des variables avec des plages très différentes dominent le modèle.

Min-Max Scaling (ramène les valeurs entre 0 et 1) : $$x_{norm} = \frac{x - x_{min}}{x_{max} - x_{min}}$$

Standardisation (moyenne 0, écart-type 1) : $$x_{std} = \frac{x - \mu}{\sigma}$$

MéthodeQuand l’utiliser
Min-MaxQuand on veut une plage fixe [0, 1], pas d’outliers
StandardisationQuand les données suivent une distribution normale, ou avec des outliers

Évaluation§

Accuracy (Taux de précision)§

$$\text{Accuracy} = \frac{\text{Prédictions correctes}}{\text{Total des prédictions}}$$

Matrice de confusion (classification binaire)§

Prédit PositifPrédit Négatif
Réel PositifVrai Positif (VP)Faux Négatif (FN)
Réel NégatifFaux Positif (FP)Vrai Négatif (VN)

Réflexions sur l’IA§

Comment utiliser l’IA§

Les devoirs, la capacité de rédaction servent à nous rendre plus intelligents. Déléguer ce travail à une IA ne sert à rien. Il faut utiliser l’IA comme un outil pour avoir accès à l’information de manière plus pertinente.

C’est le chemin qui compte, pas la fin. Cela va servir à développer son esprit critique, organiser sa pensée et ses capacités personnelles.

Le “Descaling” en IA§

La capacité à perdre des compétences de raisonnement et d’esprit critique du fait de l’IA. Nous nous simplifions tellement la vie et demandons tout le temps de l’aide à l’IA que l’on perd cette capacité de raisonnement.

Idées de projets§

—The Gardener