Ta mission

Tu vas jouer le rôle d'un analyste de données critique face à une intelligence artificielle. Ton défi : demander à l'IA des informations statistiques sur un sujet de ton choix, puis utiliser des méthodes rigoureuses et reconnues pour vérifier si les données et leurs sources sont fiables et valides.

Pourquoi c'est important? L'IA peut inventer des statistiques qui semblent vraies, citer des études inexistantes ou présenter des données biaisées. Elle peut aussi confondre corrélation et causalité, ou utiliser des échantillons non représentatifs. En mathématiques, tu dois savoir détecter ces erreurs pour exercer ton jugement critique!
Exemples de sujets exploitables

Cette activité peut être réalisée avec divers sujets impliquant des données statistiques :

  • Environnement : émissions de GES, consommation énergétique, véhicules électriques
  • Santé publique : taux de vaccination, maladies, habitudes de vie
  • Économie : inflation, emploi, revenus, coût de la vie
  • Éducation : taux de diplomation, résultats scolaires
  • Démographie : population, migration, vieillissement
  • Transport : accidents, modes de déplacement, consommation
1 Avant de commencer

Étape A : Identifie le sujet statistique à explorer

Avec ton enseignant, identifie un sujet pour lequel tu auras besoin de données statistiques. Avant de questionner l'IA, note ce que tu sais déjà sur ce sujet et les types de données que tu t'attends à trouver.

Auto-évaluation de mes connaissances
  • J'ai identifié le sujet et les questions statistiques à explorer
  • J'ai une idée des types de données attendues (pourcentages, moyennes, tendances)
  • Je connais quelques sources fiables qui pourraient fournir ces données
  • J'ai noté mes hypothèses sur ce que les données pourraient révéler

Étape B : Découvre la méthode SIFT adaptée aux données

La méthode SIFT aide à vérifier rapidement une source. En contexte statistique, elle permet de valider que les données citées existent réellement et proviennent d'une source légitime.

S I F T La méthode en 4 étapes (version statistique)
Stop (Arrête-toi)

Avant d'accepter une statistique, fais une pause. Cette donnée te semble-t-elle plausible? Est-ce que tu connais l'organisme qui l'aurait produite?

Investigate (Investigue la source)

Qui a collecté ces données? Est-ce un organisme reconnu (Statistique Canada, INSPQ, OMS)? Quelle est sa mission : informer objectivement ou défendre une position?

Find (Fouille d'autres sources)

D'autres sources rapportent-elles des données similaires? Un seul sondage ou une seule étude ne suffit pas pour établir un fait statistique.

Trace (Trouve l'origine)

Remonte à la source originale des données. La statistique a-t-elle été sortie de son contexte? Les chiffres ont-ils été arrondis ou modifiés de façon trompeuse?

Étape C : Découvre les critères CRAAP pour les données statistiques

Les critères CRAAP évaluent la qualité d'une source. En statistique, ils t'aident aussi à vérifier la validité méthodologique des données.

Critère Application aux données statistiques Questions à te poser
Currency (Actualité) Les données sont-elles récentes? De quelle année datent ces données? Sont-elles encore pertinentes pour la situation actuelle?
Relevance (Pertinence) Les données répondent-elles à ta question? L'échantillon correspond-il à la population étudiée? Les données mesurent-elles bien ce qu'on veut savoir?
Authority (Autorité) Qui a produit ces données? L'organisme est-il reconnu? A-t-il l'expertise pour collecter ces données? Quelle est sa méthodologie?
Accuracy (Exactitude) Les données sont-elles précises et vérifiables? Quelle est la taille de l'échantillon? La marge d'erreur est-elle indiquée? La méthode de collecte est-elle décrite?
Purpose (But) Dans quel but ces données ont-elles été publiées? L'organisme cherche-t-il à informer, persuader ou vendre? Y a-t-il un biais potentiel dans la présentation?

Étape D : Identifie les biais statistiques courants

L'IA peut reproduire ou créer des présentations biaisées de données. Voici les pièges à surveiller :

Type de biais Description Exemple
Échantillon non représentatif L'échantillon ne reflète pas la population étudiée Un sondage en ligne qui exclut les personnes sans accès à Internet
Confusion corrélation/causalité Affirmer qu'un lien statistique prouve une relation de cause à effet « Les ventes de crème glacée causent les noyades » (les deux augmentent en été)
Graphique trompeur Axes tronqués, échelles non proportionnelles Un axe Y commençant à 95 % au lieu de 0 % exagère visuellement une petite différence
Biais de sélection Sélectionner seulement les données qui appuient une thèse Montrer uniquement les années où la tendance va dans le sens voulu
Absence de contexte Présenter des chiffres sans comparaison ou référence « 1 000 cas » sans préciser sur quelle population ou période
2 Défier l'IA

Étape A : Pose une question vague à l'IA

Commence par poser une question simple à l'IA, sans exiger de sources ni de précisions méthodologiques.

Requête vague à adapter :
Donne-moi des statistiques sur [TON SUJET].

Observe la réponse :

  • L'IA a-t-elle indiqué d'où proviennent ces chiffres?
  • A-t-elle précisé l'année, la taille de l'échantillon ou la méthodologie?
  • Les statistiques te semblent-elles plausibles? Applique le « S » de SIFT.

Étape B : Construis une meilleure requête avec la méthode RTF

La méthode RTF (Rôle-Tâche-Format) te permet d'obtenir des données vérifiables. Glisse les bons segments pour construire une requête qui te donnera des statistiques avec leurs sources complètes.

Construis ta requête RTF pour obtenir des données vérifiables
Rappel : Une bonne requête donne un Rôle à l'IA, décrit la Tâche précise et indique le Format attendu. Pour analyser des données statistiques, tu dois demander des informations qui te permettront d'appliquer SIFT et CRAAP : source, année, taille d'échantillon, méthodologie. Attention aux pièges!

Segments disponibles (glisse ceux dont tu as besoin) :

Ta requête (dépose les segments ici) :

Glisse les segments ici pour construire ta requête...
Ta requête complète :

Étape C : Recueille les informations pour évaluer les données

Une fois que tu as obtenu une réponse avec des statistiques et leurs sources, note les informations suivantes pour chaque donnée citée.

Information à noter Utilité pour SIFT ou CRAAP
Nom de l'organisme ou de l'étude Pour vérifier si la source existe (SIFT - Trace) et son autorité (CRAAP)
Année de collecte des données Pour évaluer l'actualité (CRAAP - Currency)
Taille de l'échantillon Pour évaluer la représentativité et l'exactitude (CRAAP - Accuracy)
Méthode d'échantillonnage Pour détecter les biais possibles (CRAAP - Accuracy)
Marge d'erreur ou intervalle de confiance Pour évaluer la précision des résultats (CRAAP - Accuracy)
Lien ou référence complète Pour retrouver la source originale (SIFT - Trace)

Étape D : Pose des questions de suivi

Teste la capacité de l'IA à fournir des détails méthodologiques :

  • « Quelle est la taille de l'échantillon de cette étude? » (Accuracy)
  • « Comment les données ont-elles été collectées? » (Accuracy)
  • « L'échantillon est-il représentatif de la population québécoise/canadienne? » (Relevance)
  • « Existe-t-il des études plus récentes sur ce sujet? » (Currency)
  • « Y a-t-il des données qui contredisent ces résultats? » (Find)
  • « Quelle est la marge d'erreur de ces statistiques? » (Accuracy)
3 Valide comme un expert

Étape A : Applique la méthode SIFT aux données

Pour chaque statistique citée par l'IA, vérifie d'abord si la source existe réellement :

SIFT - Vérification des sources de données
  • Stop : Cette statistique me semble-t-elle plausible? Est-ce un organisme que je connais?
  • Investigate : J'ai recherché l'organisme cité (Statistique Canada, INSPQ, etc.) pour vérifier qu'il existe
  • Find : J'ai cherché si d'autres sources rapportent des données similaires
  • Trace : J'ai retrouvé le rapport ou l'étude originale et vérifié que les chiffres correspondent
Attention aux « hallucinations statistiques »! L'IA peut inventer des pourcentages précis qui semblent crédibles, citer des études inexistantes avec des titres convaincants, ou attribuer des données à des organismes reconnus sans que ceux-ci les aient jamais publiées. Si tu ne retrouves pas la donnée après une recherche sérieuse, elle a probablement été inventée.

Étape B : Applique les critères CRAAP aux données vérifiées

Pour chaque source de données qui existe réellement, évalue sa qualité statistique. Donne un score de 0 à 5 pour chaque critère.

Score Signification Exemple en statistique
5 Excellent Données de Statistique Canada avec méthodologie détaillée et échantillon représentatif
4 Très bien Étude d'un organisme reconnu avec quelques limites mentionnées
3 Acceptable Données crédibles mais méthodologie incomplète ou échantillon moyen
2 Faible Source peu connue, échantillon petit ou méthodologie douteuse
1 Très faible Aucune méthodologie, source biaisée ou données anciennes
0 Non fiable Source inexistante, données inventées ou manifestement fausses

Étape C : Vérifie la cohérence données-interprétation

L'IA peut citer des données réelles mais les interpréter incorrectement. Vérifie :

Vérification de l'interprétation
  • L'IA distingue-t-elle corrélation et causalité?
  • Les conclusions sont-elles soutenues par les données présentées?
  • Le contexte des données est-il respecté (population, période, lieu)?
  • Les limites de l'étude sont-elles mentionnées?
  • Les données sont-elles présentées de façon équilibrée (pas de cherry-picking)?

Étape D : Réfléchis à la sobriété numérique

Chaque requête à une IA consomme de l'énergie et des ressources. Réfléchis à ton utilisation :

Réflexion sur l'utilisation de l'IA
  • Aurais-tu pu trouver ces données directement sur le site de Statistique Canada ou de l'INSPQ?
  • As-tu formulé des requêtes précises pour éviter les allers-retours inutiles?
  • Pour des données officielles, un accès direct aux sources est-il plus efficace?
  • Quelle est la valeur ajoutée de l'IA par rapport à une recherche documentaire classique?
Bravo! Tu as développé des compétences essentielles en analyse critique de données. Tu sais maintenant reconnaître les sources de biais possibles et déployer un raisonnement mathématique pour valider des informations statistiques. Ces habiletés te serviront dans toutes les disciplines et dans ta vie citoyenne!