Jean-Paul Fischer : Sur le déclin des performances en calcul

Premier auteur français d’une thèse de Didactique des mathématiques et professeur émérite de l’Université de Lorraine, Jean-Paul Fischer relativise la portée de la dernière étude de la Depp sur 30 ans de résultats en calcul en Cm2. " Tout cela concourt à voir l’étude de la Depp non pas comme une évaluation de la qualité de l’enseignement scolaire mais plutôt comme une comparaison d’intérêt historique. J’attribue alors la décrue des résultats entre 1987 et 2017 à des causes multiples (aussi sociologiques, dont je n’ai pas parlé) dont l’addition, la conjugaison et l’interaction m’échappent en grande partie. Parmi ces causes, je ne rejette pas totalement celle de l’influence des programmes scolaires."

Une extrapolation linéaire à partir des données extrêmes (de 1987 et 2017) de la Depp (Chabanon & Pastor, 2019) montre qu’en 2089 aucun élève ne saura plus résoudre aucun des calculs ou problèmes que savaient résoudre une majorité d’élèves en 1987. Cela paraissant trop extrême pour être vrai, il convient d’examiner comment ces données ont été obtenues et comment les interpréter.

Les observations décalées dans le temps présentent des difficultés spécifiques dont certaines sont faciles à comprendre. Par exemple, c’est la première mesure (de 1987 ici) qui détermine le choix des items qui seront repris ultérieurement. Il en résulte que des activités fondamentales en 1987, mais qui peuvent ne plus l’être en 2017, seront très bien représentées dans l’échantillon d’items. Réciproquement, des activités fondamentales en 2017, mais qui ne l’étaient pas encore en 1987, risquent de ne pas figurer dans une évaluation proposée en 1987. Il en va de même du mode de réponse : en 2017 les enfants répondent souvent en appuyant les touches d’un clavier d’ordinateur, de smartphone ou de tablette et, en conséquence, beaucoup moins en écrivant avec un stylo ou crayon sur du papier que ne le faisaient les élèves en 1987.

Les items impliquant la technique opératoire posée d’une opération arithmétique (addition, soustraction, multiplication ou division) sont de bons exemples d’items qui n’ont pas le même statut en 2017 qu’en 1987, voire qu’en 2007. Dans les items retenus par la Depp, il y a de nombreux calculs impliquant une technique opératoire posée, alors que, en 2017, quasiment plus aucun adolescent ou adulte actif ne pose les opérations arithmétiques. Ainsi, dans la récente recherche ACE (Vilette et al., à paraître), nous avons choisi de ne plus enseigner l’addition posée au CP, ni la soustraction posée au CE1 (Fischer et al., 2019a). En outre, nous avons pu suggérer l’inutilité et la nuisance d’un tel enseignement précoce pour le calcul mental et la résolution de problèmes (Fischer et al., 2019b). Le fait que les techniques opératoires posées soient moins utilisées aujourd’hui n’est certes pas un argument décisif en faveur de leur non-enseignement. Mais notre choix de ne pas les enseigner dans l’expérimentation ACE est aussi motivé par deux autres raisons qui se conjuguent. L’une est que les enfants vont moins d’un dixième de leur temps de vie à l’école ; l’autre est qu’un matériel qui n’est pas réactivé par la vie quotidienne décline en mémoire. Par exemple, déjà du CM2 à la 6e, la connaissance des faits de multiplication non réactivés par la vie quotidienne (ex. : 6x8 = 48) décline, alors que celle des faits réactivés (ex. : 2x3 = 6) continue à progresser (Fischer, 2012).

Toujours à propos des items, il est important de noter que les évaluations 1987 et 1999, qui conduisent au plus gros écart (plus de deux tiers d’écart-type) n’ont, en fait, aucun item commun. Cela affaiblit donc la validité de la démonstration d’une décrue du niveau des élèves. Si, par exemple et en conséquence, les items en 1999 étaient un peu plus difficiles qu’en 1987, cela a pu contribuer à sous-estimer la performance comparative des élèves en 1999. La faible décrue observée entre 1999 et 2007 dans les données de la Depp pourrait alors être plus importante en réalité. Il convient donc de se méfier des « à-coups » particulièrement prégnants sur la Figure 5. De tels « à-coups » pourraient davantage correspondre à de simples fluctuations statistiques (dues aux items, aux élèves ou aux conditions de passation) et ne pas avoir de racines profondes. Notamment lorsqu’ils concernent des sous-populations précises comme les enfants de cadres et professions intellectuelles supérieures ou de retraités (qui remontent la pente sur la Figure 5), car la stabilisation statistique de leurs performances est moins bien assurée.

Cela vaut aussi, à un titre moindre ou pour des raisons différentes, pour la comparaison entre sexes. Les auteurs écrivent que « les garçons réussissent mieux que les filles sur toute la période, mais que l’écart de performance se réduit en 2017 ». D’abord, il faut noter que cette réduction est irrégulière et abrupte : la supériorité des garçons augmente de 4 points en 1999 par rapport à 1987, puis encore de 2 points en 2007, et ne baisse de 6 points qu’en 2017. Ensuite, si on considère que l’écart temporel extrême, celui entre 1987 et 2017, constitue la meilleure mesure de l’évolution de la différence entre sexes, on voit que, en moyenne, l’écart absolu (de 3 points) n’a pas changé (et que l’écart en pourcentage a même augmenté !).

Le nombre d’élèves testés peut paraître largement suffisant puisque, en général, les élèves de CM2 de 150 écoles ont participé aux évaluations. Mais les élèves sont regroupés dans des classes. Il est donc dommage que, dans une évaluation de la performance scolaire, le facteur « classe » soit totalement ignoré. Connaître le pourcentage de variance expliquée par l’appartenance à une classe et, surtout, son évolution, faciliterait l’interprétation des observations. Par exemple, si ce pourcentage décroît cela affaiblit l’explication par l’enseignement scolaire. En outre, les analyses au niveau des seuls élèves violent la condition statistique fondamentale d’indépendance des observations.

Enfin, si « les consignes de passation et de correction ont été répercutées à l’identique pour les quatre moments d’évaluation », on peut quand même noter que, pour les évaluations de 1987 et 1999, la correction était assurée par les professeurs des élèves de l’échantillon, alors qu’en 2007 et 2017 les réponses des élèves ont été centralisées et traitées par télé-correction. Ce que j’ai pu observer récemment dans le cadre de la recherche Elfe (Etude longitudinale française depuis l’enfance : voir www.elfe-france.fr) me convainc de l’importance de cette précision. En effet, dans cette recherche sur les performances quantitatives des enfants Elfe en Moyenne Section de maternelle, les enseignants étaient volontaires pour faire passer et corriger les items (de l’enfant Elfe et, en général, de trois autres élèves d’âge comparable). Or nous n’avons pas vraiment réussi à éviter un effet plafond (performance souvent supérieure à 80% de réussites). Les enseignants qui administrent et corrigent les évaluations de leurs propres élèves en fin d’année scolaire se sentent, au moins en partie, responsables des performances insuffisantes de leurs (ou de certains de leurs) élèves. En conséquence, ils peuvent avoir tendance à favoriser leur réussite. Malgré ma longue (depuis Fischer, 1981) et lourde (plus d’un millier d’enfants testés individuellement) expérience directe des performances numériques des élèves de maternelle, j’ai été surpris par l’ampleur de la supériorité des performances (au moins d’une demi-année) dans la recherche Elfe comparativement aux performances obtenues dans mes observations (les enfants de 4 ans ½ de la recherche Elfe ont des performances supérieures ou comparables à celles que j’ai pu attribuer aux enfants de 5 ans). Il faut donc inclure ce point dans l’interprétation des résultats de l’étude de la Depp car il a pu contribuer à accroître l’écart entre les mesures aux deux premiers moments (1987 et 1999) comparativement aux deux derniers (2007 et 2017).

Tout cela concourt à voir l’étude de la Depp non pas comme une évaluation de la qualité de l’enseignement scolaire mais plutôt comme une comparaison d’intérêt historique. J’attribue alors la décrue des résultats entre 1987 et 2017 à des causes multiples (aussi sociologiques, dont je n’ai pas parlé) dont l’addition, la conjugaison et l’interaction m’échappent en grande partie. Parmi ces causes, je ne rejette pas totalement celle de l’influence des programmes scolaires. Dans cette dernière perspective, et en accord avec la présente analyse et celle de Fischer et al. (2019b), je suggère de réduire considérablement l’enseignement des techniques opératoires posées pour renforcer celui des techniques spécifiques de calcul mental. Des calculs impliquant deux nombres à deux chiffres (ou plus) ne devraient plus conduire les élèves à la réaction verbale « il faut poser l’opération », mais à activer des procédures classiques de calcul mental exact ou d’estimation, y compris des heuristiques c’est-à-dire des procédures qui ne s’appliquent pas systématiquement mais qui sont particulièrement efficaces [par exemple, 72 + 68 c’est 2 x 70 ; ou 72 x 68 c’est 702 – 22, une heuristique qui permettrait aussi de voir que la formule algébrique a2 – b2 = (a + b)(a – b), trop souvent inculquée gratuitement, peut avoir une petite application].

Jean-Paul Fischer

Professeur émérite de l’Université de Lorraine

L'analyse de Rémi Brissiaud

L'étude Depp

Références

Chabanon L. & Pastor J.-M., 2019. L’évolution des performances en calcul des élèves de CM2 à trente ans d’intervalle (1987-2017). Note d’information n° 19.08. Paris : MENJ-DEP.

Fischer J.-P., 1981. Développement et fonctions du comptage chez l'enfant de 3 à 6 ans. Recherches en Didactique des Mathématiques, 2, 277-302.

Fischer J.-P., 2012. Que sont nos tables devenues ? Psychologie & Éducation, n° 4, 97-109.

Fischer J.-P., Sander E., Sensevy G., Vilette B. & Richard J.-F., 2019a. Can young students understand the mathematical concept of equality? A whole-year arithmetic teaching experiment in second grade. European Journal of Psychology of Education, 34(2), 439-456. DOI: 10.1007/s10212-018-0384-y

Fischer J.-P., Vilette B., Joffredo-Lebrun S., Morellato M., Le Normand C., Scheibling-Seve C. & Richard J.-F., 2019b (on line). Should we continue to teach standard written algorithms for the arithmetical operations? The example of subtraction. Educational Studies in Mathematics. DOI: 10.1007/s10649-019-09884-9

Vilette B., Fischer J.-P., Sander E., Sensevy G., Quilio S. & Richard J.-F., à paraître. Peut-on améliorer l’enseignement et l’apprentissage de l’arithmétique au CP ? Le dispositif ACE. Revue Française de Pédagogie.

caroudel, le 09/04/2019 à 10:24
Le seul fait de changer d'items rend la comparaison impossible. Et l'individu est broyé, certains améliorant, d'autres perdant en efficacité. La généralisé permet peut-être de piloter, pas de cerner les problèmes individuels.
Par ailleurs (70 + 2) (70 -2) = 70² -2² = 4900-4...

Vous devez être authentifié pour publier un commentaire.

Jean-Paul Fischer : Sur le déclin des performances en calcul

Commentaires

Fil Twitter