Dès son arrivée au ministère, le ministre de l’Éducation a mis en avant la question des données et en particulier la protection de celles des élèves et de leurs familles. Il a même mis en place un « comité d’éthique pour les données d’éducation ». Certes, on comprend, depuis la mise en place du RGPD (règlement général pour la protection des données), que le monde scolaire est un milieu particulièrement sensible pour ces questions. Cependant, on peut s’interroger sur la question plus générale des données et des enjeux et questions que cela peut soulever. Si la protection des personnes est souhaitée, c’est qu’il y a une menace, un danger ou plutôt des dangers. Le plus connu concerne le commerce et plus particulièrement la publicité. Si cette partie visible de l’iceberg semble importante, elle l’est en réalité beaucoup moins que cette autre partie qui concerne la surveillance du monde qui nous entoure.
Vigilances
Pour piloter une entreprise, une organisation, une institution, une activité, nous avons besoin de savoir ce qui s’y passe. La notion de tableau de bord qui permet aux responsables de savoir où va l’activité et comment l’orienter est bien sûr essentiel. L’état n’échappe pas à ce besoin, doté qu’il est de structures de recueil de données permettant d’établir des statistiques et de fournir des tableaux de bord : l’INSEE ou encore la DEPP du ministère de l’Éducation nationale. Ces outils de pilotages semblent indispensables, mais en même temps ils sont à risque. Rappelons ici l’affaire de la NSA américaine qui a montré les dérives possibles dans cette course aux données, dès lors qu’elle est hors du contrôle de ceux qui sont directement concernés. Depuis longtemps les pouvoirs cherchent à surveiller leur population et ont besoin de données pour y parvenir. La question est bien sûr la frontière qu’il convient d’instaurer si l’on défend une certaine idée de la liberté.
Dans l’établissement scolaire, les données sont devenues d’autant plus essentielles que l’informatisation de l’organisation scolaire et en particulier de ce que l’on nomme la « vie scolaire » (de manière impropre) a donné aux responsables d’établissement ainsi qu’aux personnels (enseignants, CPE etc.) des informations jusqu’à présent difficilement collectables de manière rigoureuse. Rappelons ici les conseils de classe projetant les données des évaluations des élèves, leur progression et les statistiques afférentes amenant à des prises de décision d’orientation. Rappelons aussi ce chef d’établissement avide de ces données pour avoir des arguments à présenter face aux parents des élèves qui viennent « réclamer » auprès de lui. De même le développement d’applications pour l’orientation scolaire (webclasseur puis Folios et peut-être Horizon) en lien avec un portfolio tout au long de la vie, appelle à une réflexion sur les données qui amènent à profiler un élève en fonction de son activité et des documents collectés dans son classeur. On le voit, protection des données, certes, mais aussi vigilance en amont sur la nature, la forme et les traitements possibles de ces données. Protéger les données personnelles c’est aussi encadrer la manière dont des données personnalisables peuvent être exploitées par d’autres personnes sans que l’intéressé(e) ne soit mis au courant.
Eduquer aux données
Pour poursuivre ce panorama de la question des données, il faut aussi observer la manière dont elles sont intégrées dans notre quotidien informationnel et celui de nos élèves. De la météo à la crise sanitaire, des enquêtes de la DEPP aux sondages d’opinion, des enquêtes déclaratives aux relevés automatiques d’information, la question initiale est de savoir comment sont construites ces données. Rappelons ici qu’une donnée, c’est d’abord un fait transformé en signe voire signifiant. Cela veut dire qu’un fait devient un élément de valeur que l’on va pouvoir intégrer dans un système plus large d’analyse. Ainsi en est-il des relevés de température ou d’hygrométrie dès lors que l’on veut analyser l’évolution du climat ou prévoir le temps. Lorsqu’un sondeur interroge une personne sur un sujet précis, il construit des données à partir d’une procédure (thématique, questions, méthode, panel…) qui doit alimenter un réservoir qui va ensuite faire l’objet d’un traitement. À l’issue de ce traitement une synthèse va être présentée et interprétée en appliquant à nouveau une approche méthodique parfois discutable. De plus, lorsque ces synthèses sont rendues publiques, elles font l’objet d’un traitement médiatique très variable. La manière dont une enquête est présentée dans un média est influencée par plusieurs facteurs dont la popularité recherchée (en particulier dans le titre) n’est pas le moindre.
L’exemple actuel du suivi des données concernant la pandémie est particulièrement intéressant. Beaucoup de personnes ne perçoivent que les analyses médiatiques qui leur sont proposées dans tous les médias et commentées sur les réseaux sociaux numériques. Quand on évoque la nécessité d’aller voir plus loin et qu’on invite quelqu’un à consulter le site Covidtracker on entend parfois dire que c’est trop compliqué, que l’on n’a pas le temps d’aller approfondir. Et pourtant, ce premier travail de vérification est essentiel. Un deuxième travail doit aussi être engagé pour tenter d’y voir clair : comprendre à partir de quelles données initiales sont établies ces statistiques et ces analyses. On s’aperçoit rapidement, et cela est confirmé par les auteurs de ces sites, qu’il faut émettre de nombreuses réserves quant à la manière dont les faits sont recueillis et transformés en données. À partir de cet exemple nous comprenons mieux l’écart possible entre des résultats rendus publics et des faits réels. Cela prend d’autant plus de force que chacun a sa perception des faits par sa propre expérience et que cela suffit pour contredire des analyses : « je connais quelqu’un qui », « un ami m’a dit que », « moi, j’ai vécu cela » etc. Autrement dit entre des données analysées dont on peut questionner les fondements et les témoignages individuels présentés comme des analyses voire des vérités….
Sans tomber dans le scepticisme portant au complotisme, force est d’accepter l’incertitude, même quand elle porte sur des faits traités de manière rigoureuse (scientifique disent certains). C’est pourquoi éduquer aux données est un élément indispensable des savoirs et compétences, en partie numériques, auquel chaque jeune, chaque élève doit accéder. Et il ne s’agit pas simplement de « se protéger » sur un plan légal, mais aussi de « se protéger » sur un plan cognitif et intellectuel. Comme pour l’éducation aux médias, on ne peut développer une telle éducation aux données sans les faire construire par les élèves, les étudiants. La connaissance des méthodologies, celle des biais, celle des processus de traitement ne peut s’acquérir simplement par des discours ou des lectures. Il faut aussi « Faire » pour comprendre. Faire et aussi défaire des analyses existantes pour en comprendre les rouages. Enfin si l’on veut aider jeunes et adultes à comprendre les controverses entre scientifiques, il faut alors effectuer ce travail de compréhension des mécaniques d’enquêtes en commençant par un point essentiel : quelle est l’intention de l’enquêteur ? C’est bien sûr le premier biais d’une enquête quand celui ou celle qui la fait attend un résultat qui le conforte (biais de confirmation) dans ce qu’il attend. Alors, on voit qu’une manipulation peut facilement s’opérer qui part bien sûr de la fabrication des données de base qui servent pour l’analyse.
Bruno Devauchelle