Ta mission
Tu vas jouer le rôle d'un analyste de données critique face à une intelligence artificielle. Ton défi : demander à l'IA des informations statistiques sur un sujet de ton choix, puis utiliser des méthodes rigoureuses et reconnues pour vérifier si les données et leurs sources sont fiables et valides.
Cette activité peut être réalisée avec divers sujets impliquant des données statistiques :
- Environnement : émissions de GES, consommation énergétique, véhicules électriques
- Santé publique : taux de vaccination, maladies, habitudes de vie
- Économie : inflation, emploi, revenus, coût de la vie
- Éducation : taux de diplomation, résultats scolaires
- Démographie : population, migration, vieillissement
- Transport : accidents, modes de déplacement, consommation
Étape A : Identifie le sujet statistique à explorer
Avec ton enseignant, identifie un sujet pour lequel tu auras besoin de données statistiques. Avant de questionner l'IA, note ce que tu sais déjà sur ce sujet et les types de données que tu t'attends à trouver.
- J'ai identifié le sujet et les questions statistiques à explorer
- J'ai une idée des types de données attendues (pourcentages, moyennes, tendances)
- Je connais quelques sources fiables qui pourraient fournir ces données
- J'ai noté mes hypothèses sur ce que les données pourraient révéler
Étape B : Découvre la méthode SIFT adaptée aux données
La méthode SIFT aide à vérifier rapidement une source. En contexte statistique, elle permet de valider que les données citées existent réellement et proviennent d'une source légitime.
Avant d'accepter une statistique, fais une pause. Cette donnée te semble-t-elle plausible? Est-ce que tu connais l'organisme qui l'aurait produite?
Qui a collecté ces données? Est-ce un organisme reconnu (Statistique Canada, INSPQ, OMS)? Quelle est sa mission : informer objectivement ou défendre une position?
D'autres sources rapportent-elles des données similaires? Un seul sondage ou une seule étude ne suffit pas pour établir un fait statistique.
Remonte à la source originale des données. La statistique a-t-elle été sortie de son contexte? Les chiffres ont-ils été arrondis ou modifiés de façon trompeuse?
Étape C : Découvre les critères CRAAP pour les données statistiques
Les critères CRAAP évaluent la qualité d'une source. En statistique, ils t'aident aussi à vérifier la validité méthodologique des données.
| Critère | Application aux données statistiques | Questions à te poser |
|---|---|---|
| Currency (Actualité) | Les données sont-elles récentes? | De quelle année datent ces données? Sont-elles encore pertinentes pour la situation actuelle? |
| Relevance (Pertinence) | Les données répondent-elles à ta question? | L'échantillon correspond-il à la population étudiée? Les données mesurent-elles bien ce qu'on veut savoir? |
| Authority (Autorité) | Qui a produit ces données? | L'organisme est-il reconnu? A-t-il l'expertise pour collecter ces données? Quelle est sa méthodologie? |
| Accuracy (Exactitude) | Les données sont-elles précises et vérifiables? | Quelle est la taille de l'échantillon? La marge d'erreur est-elle indiquée? La méthode de collecte est-elle décrite? |
| Purpose (But) | Dans quel but ces données ont-elles été publiées? | L'organisme cherche-t-il à informer, persuader ou vendre? Y a-t-il un biais potentiel dans la présentation? |
Étape D : Identifie les biais statistiques courants
L'IA peut reproduire ou créer des présentations biaisées de données. Voici les pièges à surveiller :
| Type de biais | Description | Exemple |
|---|---|---|
| Échantillon non représentatif | L'échantillon ne reflète pas la population étudiée | Un sondage en ligne qui exclut les personnes sans accès à Internet |
| Confusion corrélation/causalité | Affirmer qu'un lien statistique prouve une relation de cause à effet | « Les ventes de crème glacée causent les noyades » (les deux augmentent en été) |
| Graphique trompeur | Axes tronqués, échelles non proportionnelles | Un axe Y commençant à 95 % au lieu de 0 % exagère visuellement une petite différence |
| Biais de sélection | Sélectionner seulement les données qui appuient une thèse | Montrer uniquement les années où la tendance va dans le sens voulu |
| Absence de contexte | Présenter des chiffres sans comparaison ou référence | « 1 000 cas » sans préciser sur quelle population ou période |
Étape A : Pose une question vague à l'IA
Commence par poser une question simple à l'IA, sans exiger de sources ni de précisions méthodologiques.
Observe la réponse :
- L'IA a-t-elle indiqué d'où proviennent ces chiffres?
- A-t-elle précisé l'année, la taille de l'échantillon ou la méthodologie?
- Les statistiques te semblent-elles plausibles? Applique le « S » de SIFT.
Étape B : Construis une meilleure requête avec la méthode RTF
La méthode RTF (Rôle-Tâche-Format) te permet d'obtenir des données vérifiables. Glisse les bons segments pour construire une requête qui te donnera des statistiques avec leurs sources complètes.
Segments disponibles (glisse ceux dont tu as besoin) :
Ta requête (dépose les segments ici) :
Étape C : Recueille les informations pour évaluer les données
Une fois que tu as obtenu une réponse avec des statistiques et leurs sources, note les informations suivantes pour chaque donnée citée.
| Information à noter | Utilité pour SIFT ou CRAAP |
|---|---|
| Nom de l'organisme ou de l'étude | Pour vérifier si la source existe (SIFT - Trace) et son autorité (CRAAP) |
| Année de collecte des données | Pour évaluer l'actualité (CRAAP - Currency) |
| Taille de l'échantillon | Pour évaluer la représentativité et l'exactitude (CRAAP - Accuracy) |
| Méthode d'échantillonnage | Pour détecter les biais possibles (CRAAP - Accuracy) |
| Marge d'erreur ou intervalle de confiance | Pour évaluer la précision des résultats (CRAAP - Accuracy) |
| Lien ou référence complète | Pour retrouver la source originale (SIFT - Trace) |
Étape D : Pose des questions de suivi
Teste la capacité de l'IA à fournir des détails méthodologiques :
- « Quelle est la taille de l'échantillon de cette étude? » (Accuracy)
- « Comment les données ont-elles été collectées? » (Accuracy)
- « L'échantillon est-il représentatif de la population québécoise/canadienne? » (Relevance)
- « Existe-t-il des études plus récentes sur ce sujet? » (Currency)
- « Y a-t-il des données qui contredisent ces résultats? » (Find)
- « Quelle est la marge d'erreur de ces statistiques? » (Accuracy)
Étape A : Applique la méthode SIFT aux données
Pour chaque statistique citée par l'IA, vérifie d'abord si la source existe réellement :
- Stop : Cette statistique me semble-t-elle plausible? Est-ce un organisme que je connais?
- Investigate : J'ai recherché l'organisme cité (Statistique Canada, INSPQ, etc.) pour vérifier qu'il existe
- Find : J'ai cherché si d'autres sources rapportent des données similaires
- Trace : J'ai retrouvé le rapport ou l'étude originale et vérifié que les chiffres correspondent
Étape B : Applique les critères CRAAP aux données vérifiées
Pour chaque source de données qui existe réellement, évalue sa qualité statistique. Donne un score de 0 à 5 pour chaque critère.
| Score | Signification | Exemple en statistique |
|---|---|---|
| 5 | Excellent | Données de Statistique Canada avec méthodologie détaillée et échantillon représentatif |
| 4 | Très bien | Étude d'un organisme reconnu avec quelques limites mentionnées |
| 3 | Acceptable | Données crédibles mais méthodologie incomplète ou échantillon moyen |
| 2 | Faible | Source peu connue, échantillon petit ou méthodologie douteuse |
| 1 | Très faible | Aucune méthodologie, source biaisée ou données anciennes |
| 0 | Non fiable | Source inexistante, données inventées ou manifestement fausses |
Étape C : Vérifie la cohérence données-interprétation
L'IA peut citer des données réelles mais les interpréter incorrectement. Vérifie :
- L'IA distingue-t-elle corrélation et causalité?
- Les conclusions sont-elles soutenues par les données présentées?
- Le contexte des données est-il respecté (population, période, lieu)?
- Les limites de l'étude sont-elles mentionnées?
- Les données sont-elles présentées de façon équilibrée (pas de cherry-picking)?
Étape D : Réfléchis à la sobriété numérique
Chaque requête à une IA consomme de l'énergie et des ressources. Réfléchis à ton utilisation :
- Aurais-tu pu trouver ces données directement sur le site de Statistique Canada ou de l'INSPQ?
- As-tu formulé des requêtes précises pour éviter les allers-retours inutiles?
- Pour des données officielles, un accès direct aux sources est-il plus efficace?
- Quelle est la valeur ajoutée de l'IA par rapport à une recherche documentaire classique?