Pierre Merle : Que sait-on des pratiques d'évaluation scolaires ?

« Il existe des principes d’évaluation des compétences scolaires plus favorables aux apprentissages que ceux trop souvent en vigueur dans l’école française ». Avec ce nouveau livre (Les pratiques d’évaluation scolaire, PUF), Pierre Merle propose une véritable synthèse sur l’histoire et les différents types d’évaluation. Il montre aussi que l’évaluation évolue dans l’école française au bénéfice d’une évaluation formative plus adaptée aux besoins des élèves. Surtout il nous fait découvrir beaucoup de choses sur les différents types d’évaluation et leurs effets sur les élèves et les correcteurs. Des effets qui posent notamment la question de la « note juste ».

S’il y a bien une activité qui définit le métier enseignant , c’est bien l’évaluation. Au point que les professeurs ont l’impression de passer leur temps à cela et vivent l’année comme une suite de devoirs à corriger. Et il est vrai qu’ils passent beaucoup de temps sur cette seule forme d’évaluation. Si l’on en croit la Depp, les professeurs des écoles consacrent 3h36 par semaine aux corrections. Dans le second degré, les professeurs de lettres et de maths consacrent 6h33 et 6h34 à corriger, contre 7h31 aux professeurs de langues et encore 1h49 pour le professeur d’EPS.

Si l’évaluation est emblématique du métier enseignant, pour autant la lecture du livre de Pierre Merle montre qu’elle est encore très méconnue. Pierre Merle nous fait découvrir l’invention de la note, depuis les collèges jésuites jusqu’à la découverte de la notation sur 20 par Polytechnique. Il montre que l’invention de la note relève d’un processus scolaire mais aussi économique et politique.

Autre point fort de l’ouvrage, l’état des connaissances en docimologie. Alors que chaque professeur pense noter avec rigueur et justesse, l’ouvrage montre tous les biais qui influent sur la notation : modes d’évaluation, effets d’ordre et de contraste, mais aussi biais liés aux caractéristiques scolaire et sociales des élèves. Cela lui permet d’être sévère pour l’évaluation prévue du le futur bac. Il analyse aussi les comportements des élèves face à l’évaluation, de la séduction à la contestation, et ce n’est pas le chapitre qui en apprend le moins…

Les deux derniers chapitres font un bilan et ouvrent une prospective. Pour P. Merle, l’évaluation traditionnelle est un obstacle aux apprentissages. Et il explique pourquoi. Il pose les principes d’une évaluation plus équitable et plus efficace. En se basant sur des études, il montre que les nouvelles pratiques , comme les classes sans notes, font progresser les élèves.

Cette partie fera probablement polémique , même si elle est bien étayée. Pourtant tout enseignant a pu constater d’énormes écarts d’un correcteur à un autre et a découvert que son évaluation finale n’est pas exempte de biais plus ou moins conscients, ne serait ce que le désir d’aider tel ou tel élève, ou la prise en compte de ses progrès. Il y a une dernière raison pour réfléchir sur sa pratique de l’évaluation. C’est que, comme le montre C Terrier, celle ci influe beaucoup sur les résultats des élèves. Au point que c’est peut-être l’élément le plus facile à changer pour faire progresser l’école.

François Jarraud

Pierre Merle, Les pratiques d’évaluation scolaire. Historique, difficultés, perspectives, PUF 2018, ISBN 978-2-13-080412-3, 25€.

Pierre Merle : « La notation traditionnelle est un problème pour les élèves en difficulté scolaire »

Pourquoi tant d’ignorance sur l’évaluation ? Pierre Merle répond à 6 questions du Café pédagogique. A commencer par l’impossible notation juste…

Vous dites que la note juste est impossible. Pourquoi ?

Sur cette question, il existe des centaines de recherches. Les premières ont été menées sur les épreuves du Certificat d’Etudes Primaires par Alfred Binet au début du XXe siècle, peu après l’invention des notes ! Dans les années 1930, ces recherches ont même fait l’objet d’une discipline nouvelle – la docimologie – centrée sur l’analyse statistique des notes et des examens. Toutes les recherches sont concordantes. Même avec un barème, y compris en mathématiques, la subjectivité des correcteurs est considérable. A titre d’exemple, l’ordre de correction des copies est un facteur important et souvent méconnu d’incertitude de la notation car le correcteur est inévitablement influencé par la correction de la copie précédente. Évaluer est un exercice de comparaison. Après une excellente copie, le professeur note plus sévèrement. Après une copie très faible, la notation est plus indulgente.

Laugier et Weinberg ont calculé que, pour obtenir une « note vraie » aux épreuves du baccalauréat de 1930 (la « note vraie » correspond à la valeur scolaire d’une copie avec une marge d’erreur statistique faible), il faudrait recourir à la moyenne des notes de 13 correcteurs en mathématiques, 78 en composition française et 127 en philosophie. Ce calcul a l’intérêt de montrer que, compte tenu des aléas importants d’évaluation de chaque copie, la recherche d’une « note vraie » constitue une utopie scolaire. Les recherches ultérieures ont confirmé ce résultat.

Si l’évaluation traditionnelle est injuste, elle est injuste pour qui ?

La notation traditionnelle est injuste car, outre l’aléa de la note, il existe des « biais » de notation, c’est-à-dire des erreurs systématiques d’appréciation liées notamment aux effets d’attente et stéréotypes inconscients des correcteurs. Ainsi, les élèves redoublants et/ou plus âgés sont notés plus sévèrement que les élèves « à l’heure ». Un autre biais de notation concerne les enfants des catégories aisées. A compétences égales mesurées par des tests de compétences standardisés, ils sont systématiquement notés de façon plus indulgente que les autres élèves. Ce biais spécifique d’évaluation, présent dans toutes les recherches, est statistiquement très robuste. Il existe aussi des biais d’évaluation selon le genre. Ce biais est variable selon la discipline et le niveau scolaire. Par exemple, en classe de sixième, les filles sont mieux notées que les garçons à compétences égales. Mais ce biais est inversé en classe de seconde. Ce sont les garçons qui sont sur-notés en mathématiques.

La notation traditionnelle est injuste aussi pour une autre raison : elle exerce des effets défavorables aux apprentissages des élèves en difficulté scolaire. Des notes faibles provoquent un processus psychologique de « résignation apprise ». Les élèves sont découragés, développent un sentiment d’incompétence scolaire qui réduit sensiblement leur « ressources attentionnelles ». Cette résignation apprise bloque le processus d’apprentissage. Elle est notamment liée « aux comparaisons sociales forcées » produites par le recours aux notes. Pour les élèves en difficulté, la comparaison systématique à des élèves meilleurs provoque une baisse du sentiment de compétence scolaire, source de décrochage et de déviance, notamment d’absentéisme, de dégradation de matériel, de violences verbales et physiques.

L’évaluation est aussi au coeur des projets ministériels. On se rappelle les projets de Najat Vallaud Belkacem pour la changer. Que penser de ceux-ci ?

Sur les pratiques d’évaluation, la réforme des pratiques d’évaluation souhaitée par Najat Vallaud Belkacem a prolongé une réflexion menée depuis 2005 sur « l’évaluation par compétences ». Depuis les années 2000, à l’école élémentaire, une évaluation par compétences a progressivement remplacé l’évaluation par note. Avec cette nouvelle pratique d’évaluation, pour une même copie, le professeur précise, par exemple par un code couleur (vert compétences acquises, jaune pour compétences presque acquises, orange pour compétences en cours d’acquisition, rouge pour compétences non acquises), le niveau de maîtrise des différentes compétences évaluées lors de chaque contrôle. Cette pratique d’évaluation revient à donner à chaque élève des indications beaucoup plus précises qu’une note globale. Il s’agit d’une « évaluation pour les apprentissages » qui a pour objet de guider l’élève alors qu’une note, mesure synthétique mais imprécise, constitue une modalité d’évaluation des apprentissages. L’évaluation par compétences est une évaluation dite « formative » sa finalité première est d’aider, alors que la notation est une évaluation dite « sommative » dont la finalité première, historiquement, explicitement ou implicitement, est de classer les élèves.

Les évaluations formative et sommative ne sont certes pas exhaustives l’une de l’autre mais, dans les faits, elles se concurrencent. Lorsqu’une note est présente sur une copie, les élèves, tout comme les parents, se focalisent sur celle-ci, sont enthousiastes ou déçus et, le plus souvent, peu attentifs aux commentaires pourtant essentiels du professeur. Un autre avantage du remplacement de la notation traditionnelle par une évaluation par compétences est de réduire en partie les « comparaisons sociales forcées » (cf. ci-dessus). Il n’est pas facile de faire des moyennes et des classements avec des verts, des jaunes, des oranges et des rouges. Outre son inutilité pour les apprentissages, le classement des élèves favorise l’individualisme, voire même la tricherie. Notes et classements détournent les élèves du travail en commun alors qu’il faudrait renforcer l’enseignement de cette compétence essentielle à la vie professionnelle.

Dans la réforme du collège de 2016, les niveaux de maîtrise retenus pour évaluer les compétences des élèves (Très bonne maîtrise, maîtrise satisfaisante, maîtrise fragile, maîtrise insuffisante) pose toutefois problème. Dans les faits, une grande partie des élèves sont « en cours d’apprentissage ». Ils ont un niveau scolaire « moyen », niveau non envisagé dans cette échelle d’évaluation. Dès la fin du XIXe siècle, l’inspecteur général Pécaut préconisait une échelle d’évaluation de quatre niveaux (Mal, Passable, Assez bien, Bien). Il s’agit d’une échelle asymétrique (une seule évaluation est négative), plus pertinente pour évaluer de façon efficace les compétences scolaires des élèves que celle actuellement en vigueur (Merle, 2014).

Peut-on utiliser l’évaluation pour faire progresser ses élèves ?

Une partie des professeurs ont une connaissance variable des effets des modalités d’évaluation sur le niveau de progression de leurs élèves. À titre d’exemple, certains professeurs de mathématiques ont tendance à surévaluer les compétences scolaires des filles en classe de sixième. Concrètement, à compétences égales avec les garçons, mesurées par des tests standardisés, ces professeurs mettent des notes plus élevées aux copies rédigées par des filles. Camille Terrier (2014) a montré qu’une telle pratique évaluative favorise les progrès scolaires des filles dont les copies sont sur-notées. Ce n’est évidemment pas la note qui, en soi, permet des progressions scolaires plus rapides mais la suppression de notes très faibles qui réduit la motivation des élèves quel que soit le genre.

Dans le chapitre 8 de mon ouvrage consacré aux « Principes d’une évaluation scolaire équitable et efficace », outre l’effet positif des notes indulgentes par rapport aux notes sévères, je mentionne aussi la nécessité, autant que possible, de préserver l’anonymat social et scolaire des élèves pour réduire les biais d’évaluation (cf. question précédente). Il faut aussi avoir à l’esprit que l’usage des notes est largement majoritaire au collège, et encore plus au lycée, et que cet usage constitue une source importante de stress et d’anxiété scolaires défavorables aux processus d’apprentissage. La peur du mauvais résultat, du déclassement scolaire, des moqueries des camarades et des remontrances parentales produit des « pensées distractives » qui affectent les capacités de concentration et la réussite des élèves.

Dans le cadre de la réforme du collège, Najat Vallaud Belkacem avait raison de promouvoir la bienveillance comme principe pédagogique central. Certains professeurs se sont offusqués de ce slogan considérant que cette bienveillance était déjà présente. Ils ont certes raison. Toutefois, la recherche de Guimart (2015) montre que 75 % des collégiens ont « peur d’avoir de mauvaises notes ». Moins de mauvaises notes et plus de bienveillance seraient favorables à un meilleur climat scolaire et à des apprentissages plus rapides. En 2016, une recherche de la World Health Organisation montre aussi que les collégiens français âgés de quinze ans ont un sentiment de compétence, mesuré par la déclaration d’un bon ou très bon niveau scolaire, sensiblement plus bas que celui des élèves des autres pays. En France, seulement 45 % des filles et 43 % des garçons se déclarent « bons » ou « très bons ». Ces proportions sont respectivement de 62 % et 58 % pour la moyenne des 42 pays enquêtés. De surcroît, ce sentiment de compétence baisse sensiblement de la classe de sixième à celle de troisième. Réduire le recours aux notes en substituant une évaluation formative à une évaluation sommative a notamment pour objet d’améliorer le sentiment de compétence des élèves, indispensable à leur motivation et à leurs progressions.

Vous prenez parti pour les classes sans notes. Leurs effets sont-ils vraiment positifs et durables ?

Les classes sans note ont été expérimentées à l’initiative de Luc Chatel, ministre de l’Education nationale sous le quinquennat de Nicolas Sarkozy. Beaucoup de personnalités politiques de premier plan, généralement situées à droite, se sont opposées à cette expérimentation. En 2012, Luc Ferry déclarait « Ce n’est pas une bonne idée de supprimer les notes […]. C’est absolument indispensable d’avoir des points de repère […]. Casser le thermomètre ne sert absolument à rien. » (…) « Je ne comprends pas que des gens intelligents cèdent à l’idéologie gentillette selon laquelle les notes chiffrées seraient “traumatisantes” pour les enfants ». Le propos de l’ancien ministre manifeste une méconnaissance certaine des centaines de recherches relatives aux notes. Les notes chiffrées peuvent sans aucun doute être « traumatisantes » pour les élèves dont les notes sont régulièrement basses. Et elles ne constituent nullement un repère indispensable pour les apprentissages. Pendant des siècles, les professeurs ont d’ailleurs enseigné sans y avoir recours…

Outre que l’expérience des classes sans note fait l’objet d’une évaluation positive par une large majorité d’élèves, de professeurs et de parents, cette expérimentation a fait récemment l’objet d’une évaluation de type scientifique nettement positive en mathématiques. La comparaison des progressions des élèves de niveau comparable scolarisés dans des classes sans notes et des classes avec notes montre des progressions moyennes scolaires plus fortes dans la première situation par rapport à la seconde. Cette élévation du niveau moyen résulte d’une progression plus rapide des élèves de niveau scolaire faible sans altérer les progressions scolaires des bons élèves. Ce résultat est logique puisque ce sont les élèves faibles, ceux qui font l’objet de notes basses, qui sont pénalisés par la notation traditionnelle. Les classes sans note constituent donc un moyen de corriger une des caractéristiques centrales de l’école française : des écarts de compétences très importants entre les élèves.

L’évaluation est au cœur du métier enseignant. Et pourtant tout cela reste mal connu et objet de débats. Pourquoi ?

Cette question est centrale. La notation traditionnelle est un problème essentiellement pour les élèves en difficulté scolaire, ceux qui font l’objet, souvent dès le début de leur scolarité, de notes faibles dans plusieurs, voire la totalité des disciplines. Progressivement, ces élèves ont un sentiment de nullité scolaire qui débouche sur de la « résignation apprise » et une grande passivité en classe. La récurrence des mauvaises notes a détruit la motivation de ces élèves, parfois atteints d’apathie chronique, de burn out et de phobie scolaires.

À l’inverse, pour les bons élèves, la note traditionnelle renforce leur sentiment de compétence, leur motivation et leur désir de réussite. Après des études supérieures réussies, cette élite scolaire compose une partie des élites économiques et politiques. Leur expérience subjective de l’école, fortement positive, les conduit à une vision conservatrice de celle-ci, surtout à l’égard des notes qui ont consacré leur réussite scolaire. Seule la connaissance scientifique leur permettrait d’objectiver leur expérience personnelle, de comprendre sa singularité en tant que membre de l’élite scolaire et sociale, et la nécessité de promouvoir une autre façon d’évaluer les compétences des élèves pour réduire l’échec scolaire. Cette connaissance est trop souvent absente.

Lorsque J.-M. Huart, directeur général de l’enseignement scolaire, le numéro deux du ministère après le ministre, déclare que « L’intérêt de la note, c’est la clarté dans le cadre d’un dialogue avec les familles », il contribue à la désinformation des parents et des professeurs sur la question centrale des pratiques d’évaluation des élèves. Cette défense de la note traditionnelle, tout à fait contraire à la connaissance scientifique dont le ministère prétend pourtant s’inspirer, participe à la perpétuation d’une des lacunes majeures de l’école française, le nombre très élevé, presque 100 000, des jeunes sortant chaque année sans diplôme. Le coût économique et humain de cet échec scolaire est considérable. Envers les professeurs, les parents et l’ensemble des citoyens, un devoir moral de vérité et de connaissances devrait, quelles que soient les responsabilités exercées, toujours primer sur l’opportunité politique et la défense d’une tradition scolaire source d’injustice et d’inégalités scolaires. Par ignorance ou par cynisme, consciemment ou pas, les élites économiques et politiques privilégient trop souvent leurs intérêts particuliers à ceux de la nation.

Propos recueillis par François Jarraud

Pierre Merle, Les pratiques d’évaluation scolaire. Historique, difficultés, perspectives, PUF 2018, ISBN 978-2-13-080412-3, 25€.

Références

Guimart Philippe et al. (2015), « Le bien-être des élèves à l’école et au collège », Éducation et formations, n° 88-89, p. 163-184.

France Culture, La Rue des écoles, « L’école abuse-t-elle thèse des notes ? », 20 mai 2018, https://www.franceculture.fr/emissions/rue-des-ecoles/lecole-abuse-t-elle-des-notes

Merle Pierre (2014), « L’échelle de notation des élèves : un faux problème ? », Le Café pédagogique.

Terrier Camille (2014), « Un coup de pouce pour les filles ? Les biais de genre dans les notes des enseignants et leur effet sur le progrès des élèves », Les Notes de l’IPP, n° 14.

Dans le Café : C Terrier : quand les études de genre révolutionnent l’évaluation