Évaluation à grande échelle des apprentissages

Les évaluations à grande échelle des apprentissages (Large-scale learning assessments, LSLA) sont des épreuves standardisées, organisées au niveau national ou transnational offrent un instantané des acquis d’un groupe d’apprenants lors d’une année donnée et pour un nombre limité de domaines d’apprentissage^[1]. D’abord utilisées pour mesurer les compétences en lecture et en mathématiques, elles ciblent désormais un plus grand nombre de domaines, y compris les compétences numériques, les notions élémentaires en matière d’informatique et d’information, les aptitudes socioaffectives, ou la compréhension des questions et concepts relatifs au civisme et à la citoyenneté^[2].

Le potentiel de ces outils va bien au-delà de l’établissement de rapports. Ils peuvent signaler les domaines dans lesquels des améliorations sont nécessaires et aider à identifier les interventions les plus appropriées, les plus prometteuses et les plus efficaces^[3]. Ces évaluations reposent en général sur des échantillons, bien que, ces dernières décennies, un nombre croissant de pays aient opté pour un système fondé sur un recensement^[4]. Elles peuvent être centrées sur les écoles ou sur les ménages et être conçues ou non en fonction des programmes d’enseignement ; en général, les résultats ont des conséquences pour les enseignants et les écoles, mais n’en ont que très peu ou pas du tout pour les élèves qui passent les épreuves.

Contexte

L’évaluation est un élément essentiel de tout processus d’apprentissage. Les pédagogues distinguent fréquemment évaluation pour l’apprentissage et évaluation de l’apprentissage. Entrent dans la première catégorie les évaluations en salle de classe ou formatives sur lesquelles les enseignants se fondent pour adapter leurs méthodes pédagogiques ou pour noter les élèves et les classer au terme d’une certaine période d’instruction. Ces évaluations individuelles sont conçues pour mesurer et contrôler les connaissances, les compétences, les attitudes et les valeurs acquises dans tout un ensemble de matières. Elles comprennent des évaluations diagnostiques servant à repérer les élèves en difficulté et à adapter les activités d’enseignement et d’apprentissage en fonction de leurs besoins^[5].

Les évaluations de l’apprentissage et les évaluations pour l’apprentissage sont toutes deux des dimensions essentielles des systèmes de mesure des apprentissages. Ces systèmes sont constitués d’un ensemble de politiques, de structures, de pratiques et d’outils visant à générer des données sur les résultats de l’apprentissage^[6]. Ils regroupent différents types d’évaluation qui livrent des informations concernant les individus, les établissements ou le système éducatif qui sont utiles aux enseignants, aux élèves, aux planificateurs, aux responsables de l’élaboration des politiques et à d’autres parties prenantes. Ces systèmes peuvent aider les élèves à mieux apprendre, les enseignants à améliorer leurs cours, les planificateurs à décider de l’allocation des ressources et les responsables de l’élaboration des politiques et les gouvernements à corriger les déficiences du système éducatif ou à évaluer les programmes d’enseignement^[7].

Limites

Conception limitée de l'apprentissage

De par leur conception, les LSLA se limitent généralement à un petit nombre de domaines d’apprentissage aisés à mesurer et qui se prêtent à des comparaisons entre systèmes ou entre pays. Ces domaines mesurables représentent les « savoir-faire fondamentaux » et/ou connaissances générales de base, comme la lecture et les mathématiques (et parfois les sciences) qui sont considérés comme essentiels pour acquérir d’autres compétences, ainsi que pour progresser dans ces mêmes disciplines et aller plus loin. De ce fait, les LSLA tendent à se désintéresser de diverses dimensions de l’apprentissage qui sont importantes au regard des finalités multiples de l’éducation^[8]. Certes, cela n’est peut-être pas foncièrement problématique. Toutefois, dans un contexte dominé par les LSLA, le risque est que nous attachions de la valeur à ce que nous mesurons plutôt que de mesurer les apprentissages auxquels nous attachons de la valeur^[9].

Pourtant, au-delà de l’acquisition des savoir-faire fondamentaux et professionnels, ainsi que des connaissances et compétences générales, l’éducation a aussi pour fonction d’inculquer les valeurs de respect de la vie, de la dignité humaine et de la diversité culturelle qu’exige l’harmonie sociale dans un monde caractérisé par la diversité^[10]. Elle fait prendre conscience des choix qui doivent être faits quotidiennement pour vivre une existence saine et épanouie, et contribuer aux fondements sociaux, économiques et environnementaux du développement durable. L’éducation est indissociable des diverses dimensions du développement humain individuel et collectif, à l’égard desquelles elle joue un rôle pertinent. Il faut donc intégrer les multiples finalités sociales, économiques, culturelles, éthiques, environnementales, spirituelles et politiques de l’éducation et trouver le juste équilibre entre elles^[11].

Compréhension restreinte de la qualité de l'éducation

Les approches traditionnelles utilisées pour mesurer la qualité de l’éducation s’appuyaient sur des indicateurs indirects de l’offre et des intrants correspondant à des facteurs qui influent sur le progrès de l’enseignement et de l’apprentissage, comme le nombre d’élèves par enseignant, le pourcentage d’enseignants ayant reçu une formation ou les dépenses par élève en pourcentage du PIB^[12].

D’autres dimensions de l’apprentissage doivent être prises en considération aussi. Il s’agit notamment des retombées pour la société (par exemple le fait que soient encouragés les comportements propices à un développement social et environnemental durable, la citoyenneté mondiale, le vivre-ensemble et le respect de la diversité) ainsi que l’environnement offert par les écoles et les salles de classe. Ce dernier paramètre comprend le processus d’enseignement-et d’apprentissage, la présence d’enseignants convenablement formés et motivés, ainsi que la rigueur du processus pédagogique, la capacité de l’école d’exercer un vigoureux leadership, la participation de la communauté et le caractère démocratique de la gouvernance, ainsi que des structures et intrants matériels adéquats^[13].

Les LSLA sont nécessaires pour suivre la performance des systèmes éducatifs et améliorer l’apprentissage et l’équité dans les écoles, mais elles pourraient être plus utiles encore si elles étaient considérées en même temps que toute une série d’autres facteurs, scolaires et extrascolaires.

En définitive, les niveaux d’acquisition des connaissances et compétences mesurés par les LSLA sont un paramètre nécessaire, mais non le seul à l’être pour mesurer la qualité de l’éducation. Il est même permis de se demander si l’on peut correctement apprécier la qualité sans prendre en compte ces autres dimensions sociales, économiques et contextuelles^[3].

Inclusion

Les évaluations doivent être inclusives. Elles doivent être pertinentes pour un nombre aussi grand que possible de membres de la population cible et conçues pour s’adapter efficacement à tous les apprenants^[14]. L’échantillon doit donc être constitué d’un ensemble représentatif d’apprenants, dans lequel il n’est pas tenu compte des attributs individuels, notamment le milieu d’origine (socioéconomique ou autre), la situation géographique ou les performances scolaires. De même, ces principes d’équité et d’inclusion doivent s’appliquer, par exemple, à la traduction et à l’adaptation des matériels de test en fonction de différents groupes de population ou à l’intention d’enfants ayant des besoins spéciaux. Les LSLA sont très prometteuses en tant que moyen de promouvoir l’équité. Toutefois, leur conception et leur gestion ne respectent pas toujours l’impératif d’inclusion. Les enfants, jeunes et adultes vulnérables et marginalisés peuvent être exclus au moment de la constitution des échantillons, mais aussi au niveau de la classe ou de l’établissement scolaire – du fait même de la conception ou de la formulation des items. Des efforts croissants sont faits pour prendre en compte la totalité des élèves et mesurer correctement leurs progrès, mais l’entreprise demeure difficile, car les aménagements spéciaux risquent de créer à la fois des incitations perverses et des problèmes de comparabilité^[3].

Utilisation des évaluations

Sous-exploitation des données d'évaluation

Les LSLA ne peuvent devenir un moteur du changement et du progrès que si les parties concernées s’appuient sur elles pour agir. Or, divers facteurs font obstacle à un usage efficace pour éclairer les débats sur les grandes orientations et guider l’action politique, notamment l’institutionnalisation limitée des pratiques d’évaluation et l’appropriation insuffisante des financements et de la conception, de la gestion et de la diffusion des données. La mise en œuvre des évaluations nécessitant des ressources considérables, il faut impérativement que les données obtenues soient utilisées, faute de quoi l’exercice est futile ou perçu comme un gaspillage des deniers publics^[3].

Le processus d’évaluation de l’apprentissage aboutit en général à l’établissement d’un rapport qui récapitule les conclusions de l’enquête, et dont le lancement fait parfois l’objet d’un événement spécial, mais l’examen des résultats tend ensuite à s’essouffler. Les gouvernements, les organisations régionales ou internationales et les autres utilisateurs se contentent trop souvent d’expliquer l’état et les tendances de l’éducation, ou ne se font l’écho que d’un ensemble prédéfini d’indicateurs sans chercher à savoir comment utiliser au mieux les conclusions pour améliorer le contexte et le processus qui rendent l’apprentissage possible^[15]. Autre obstacle à l’exploitation productive des résultats, les LSLA ne sont pas toujours perçues comme utiles par les enseignants et les éducateurs, de sorte qu’elles n’ont finalement que peu d’impact sur l’enseignement et l’apprentissage. Si la publication d’un rapport est certes nécessaire (car elle suppose la compréhension des résultats et des relations complexes entre l’apprentissage et les variables qui influent sur lui), le simple fait de recueillir des données n’entraîne pas automatiquement une amélioration de l’apprentissage^[16]. Lorsque l’évaluation n’est pas utilisée pour susciter un changement, la mesure des résultats de l’apprentissage risque de devenir une fin en soi^[17].

Surexploitation des données d'évaluation

Accorder une attention ou un crédit excessif aux résultats des évaluations peut détourner des priorités et fausser le comportement de toute une série d’acteurs. Cela se produit dans certaines circonstances et à la faveur d’un certain nombre de processus. Premièrement, l’impact des données d’évaluation sur la formulation des politiques est perdu si les mesures politiques visent uniquement ou principalement à améliorer les chiffres et non à engager des réformes de fond^[18]. Deuxièmement, les classements au sein d’un pays et entre pays peuvent créer une dynamique de compétition qui va inciter à adopter erronément des pratiques visant à copier tel ou tel pays plutôt qu’à tirer les leçons de son expérience. Troisièmement, les données d’évaluation peuvent pousser à des analyses de causalité qui risquent d’aboutir à des conclusions mal fondées sur les effets de l’apprentissage. Enfin, l’utilisation des données d’évaluation dans les systèmes de financement axés sur les résultats qui ont de plus en plus la faveur des donateurs présente un risque important – celui d’inspirer des stratégies ayant pour objet exclusif de modifier les résultats des évaluations^[3].

Quels que soient les modes de diffusion choisis par les autorités compétentes, l’influence des LSLA passe aussi par leur impact sur l’opinion et les sentiments du public^[19]. Cet impact dépend en grande partie de l’attention que les médias vont accorder à telle ou telle évaluation. Par « médias », il faut entendre ici la presse traditionnelle, imprimée et sur les ondes, et les contenus numériques et interactifs. Une large couverture et un fort écho dans les médias permettent aux LSLA d’influer sur la vision commune de ce qui mérite d’être promu dans l’éducation^[20]. De ce fait, c’est le discours dominant tenu dans les évaluations transnationales des apprentissages les plus vastes et les plus largement diffusées, c’est-à-dire les enquêtes PISA, TIMSS et PIRLS, qui décide de ce qui sera considéré comme utile (et financé) dans un système éducatif. Si cela n’a, en soi, rien de problématique, cela risque de conforter le recours excessif aux données d’évaluation, en détournant l’attention d’autre questions pertinentes, et d’alimenter des hypothèses et des affirmations faisant état de liens de causalité erronés^[2].

Sources

Cet article est partiellement ou en totalité issu de la page « La promesse de l’évaluation à grande échelle des apprentissages : Reconnaître les limites pour libérer les potentialités » de UNESCO, le texte ayant été placé par l’auteur ou le responsable de publication sous la CC BY-SA 3.0 IGO

Références

↑ (en) Kuh, G.D.; Jankowski, N.; Ikenberry, S.O., « Knowing What Students Know and Can Do: The Current State of Learning Outcomes Assessment in U.S. Colleges and Universities », Urbana: University of Illinois and Indiana University, National Institute for Learning Outcomes Assessment.,‎ 2014 (lire en ligne)
↑ ^{a et b} (en) Addey, C., « The assessment culture of international organizations: from philosophical doubt to statistical certainty through the appearance and growth of international large-scale assessments », Assessment Cultures: Historical perspectives. Francfort-sur-le-Main Peter Lang.,‎ 2018 (lire en ligne)
↑ ^{a b c d et e} UNESCO, La promesse de l’évaluation à grande échelle des apprentissages: reconnaître les limites pour libérer les potentialités, Paris, UNESCO, 2019, 89 p. (ISBN 978-92-3-200187-0, lire en ligne)
↑ (en) Verger, A., Parcerisa, L. et Fontdevila, C., « The growth and spread of large-scale assessments and test-based accountabilities: a political sociology of global education reforms », Educational Review 71(6),‎ 2018, p. 1 - 26 (lire en ligne)
↑ (en) Clarke, M., « What Matters Most for Student Assessment Systems: A Framework Paper », SABER Working Paper No. 1. Washington D.C., Groupe de la Banque mondiale,‎ 2012 (lire en ligne)
↑ (en) Clarke, M., « Value for money: What do developing countries really get from participating in international assessment programs? », OECD Development Co-operation Directorate,‎ 2016, p. 4 (lire en ligne)
↑ (en) UNESCO, Analyzing and utilizing assessment data for better learning outcomes, Paris & Bangkok, UNESCO, 2017, 76 p. (ISBN 978-92-9223-578-9, lire en ligne)
↑ Tel a été le cas des évaluations axées sur les aspects utilitaires de l’apprentissage, et notamment sa contribution au développement économique – tout particulièrement le programme PISA. D’autres programmes d’évaluation se sont caractérisés dans le passé par une approche plus inclusive ou plus exhaustive et ont été, de ce fait, attentifs à un plus grand nombre de dimensions de l’apprentissage. Pour des raisons qui n’entrent pas dans le cadre de la présente étude, toutefois, les programmes d’évaluation existants témoignent d’une convergence croissante dans les domaines mesurés qui se traduit par une attention accrue à la maîtrise de la lecture, de l’écriture et des mathématiques.
↑ (en) Biesta, G., « Good education in an age of measurement: On the need to reconnect with the question of purpose in education », Educational Assessment, Evaluation and Accountability, Vol. 21, No. 1,‎ 2009, p. 33 - 46 (lire en ligne)
↑ UNESCO, Repenser l’éducation: vers un bien commun mondial ?, Paris, UNESCO, 2015, 95 p. (ISBN 978-92-3-200057-6, lire en ligne)
↑ (en) Hamilton, M., « How International Large-Scale Skills Assessments engage with national actors : Mobilising networks through policy, media and public knowledge », Critical Studies in Education, Vol. 58, No. 3,‎ 2017, p. 280-294 (DOI 10.1080/17508487.2017.1330761, lire en ligne)
↑ Tawil, S., Akkari, A. et Macedo, B., « Au-delà du labyrinthe conceptuel: la notion de qualité en education », Recherche et prospective en éducation n° 02,‎ 2012, p. 17 (lire en ligne)
↑ (en) Unterhalter, E. et Brighouse, H., Distribution of what for social justice in education ? The case of Education for All, New York, Amartya Sen’s capability approach and social justice in educatio Palgrave Macmillan, 2007 (ISBN 978-0-230-60481-0, lire en ligne), p. 67 - 86
↑ UNESCO, Un guide pour assurer l'inclusion et l'équité dans l'éducation, Paris, UNESCO, 2017, 46 p. (ISBN 978-92-3-200135-1, lire en ligne)
↑ (en) Tobin, M., Lietz, P., Nugroho, D., Vivekanandan, R. et Nyamkhuu, T., Using large-scale assessments of students’ learning to inform education policy Insights from the Asia-Pacific region, Bangkok, ACER et UNESCO, 2015, 20 p. (ISBN 978-1-74286-296-5, lire en ligne)
↑ Nations Unies, L’Initiative mondiale pour l’éducation avant tout, Paris, Initiative mondiale du Secrétaire général de l’ONU pour l’éducation, 2012 - 2016, 36 p. (lire en ligne)
↑ (en) UNESCO, Managing tomorrow's digital skills: what conclusions can we draw from international comparative indicators?, Paris, UNESCO, 2018, 32 p. (lire en ligne)
↑ (en) Yasukawa, K., Hamilton, M. et Evans, J., « A comparative analysis of national media responses to the OECD Survey of Adult Skills: policy making from the global to the local? », Compare: a journal of comparative and international education, Vol. 47, No. 2,‎ 2017, p. 271-285 (DOI 10.1080/03057925.2016.1158644, lire en ligne)
↑ (en) Ferrer, G. et Fiszbein, A., « What has happened with learning assessment systems in Latin America? Lessons from the Last Decade of Experience », The Dialogue: Leadership for the Americas.Commission for quality education for all: background paper. Washington D.C., Banque mondiale.,‎ 2015 (lire en ligne)
↑ (en) Steiner-Khamsi, G., Appleton, M. et Vellani, S., « Understanding business interests in international large-scale student assessments: a media analysis of The Economist, Financial Times, and Wall Street Journal », Oxford Review of Education, Vol. 44, No. 2,‎ 2017, p. 190-203 (lire en ligne)

Articles connexes

[1] (en) Kuh, G.D.; Jankowski, N.; Ikenberry, S.O., « Knowing What Students Know and Can Do: The Current State of Learning Outcomes Assessment in U.S. Colleges and Universities », Urbana: University of Illinois and Indiana University, National Institute for Learning Outcomes Assessment.,‎ 2014 (lire en ligne)

[:1-2] {a et b} (en) Addey, C., « The assessment culture of international organizations: from philosophical doubt to statistical certainty through the appearance and growth of international large-scale assessments », Assessment Cultures: Historical perspectives. Francfort-sur-le-Main Peter Lang.,‎ 2018 (lire en ligne)

[:0-3] {a b c d et e} UNESCO, La promesse de l’évaluation à grande échelle des apprentissages: reconnaître les limites pour libérer les potentialités, Paris, UNESCO, 2019, 89 p. (ISBN 978-92-3-200187-0, lire en ligne)

[4] (en) Verger, A., Parcerisa, L. et Fontdevila, C., « The growth and spread of large-scale assessments and test-based accountabilities: a political sociology of global education reforms », Educational Review 71(6),‎ 2018, p. 1 - 26 (lire en ligne)

[5] (en) Clarke, M., « What Matters Most for Student Assessment Systems: A Framework Paper », SABER Working Paper No. 1. Washington D.C., Groupe de la Banque mondiale,‎ 2012 (lire en ligne)

[6] (en) Clarke, M., « Value for money: What do developing countries really get from participating in international assessment programs? », OECD Development Co-operation Directorate,‎ 2016, p. 4 (lire en ligne)

[7] (en) UNESCO, Analyzing and utilizing assessment data for better learning outcomes, Paris & Bangkok, UNESCO, 2017, 76 p. (ISBN 978-92-9223-578-9, lire en ligne)

[8] Tel a été le cas des évaluations axées sur les aspects utilitaires de l’apprentissage, et notamment sa contribution au développement économique – tout particulièrement le programme PISA. D’autres programmes d’évaluation se sont caractérisés dans le passé par une approche plus inclusive ou plus exhaustive et ont été, de ce fait, attentifs à un plus grand nombre de dimensions de l’apprentissage. Pour des raisons qui n’entrent pas dans le cadre de la présente étude, toutefois, les programmes d’évaluation existants témoignent d’une convergence croissante dans les domaines mesurés qui se traduit par une attention accrue à la maîtrise de la lecture, de l’écriture et des mathématiques.

[9] (en) Biesta, G., « Good education in an age of measurement: On the need to reconnect with the question of purpose in education », Educational Assessment, Evaluation and Accountability, Vol. 21, No. 1,‎ 2009, p. 33 - 46 (lire en ligne)

[10] UNESCO, Repenser l’éducation: vers un bien commun mondial ?, Paris, UNESCO, 2015, 95 p. (ISBN 978-92-3-200057-6, lire en ligne)

[11] (en) Hamilton, M., « How International Large-Scale Skills Assessments engage with national actors : Mobilising networks through policy, media and public knowledge », Critical Studies in Education, Vol. 58, No. 3,‎ 2017, p. 280-294 (DOI 10.1080/17508487.2017.1330761, lire en ligne)

[12] Tawil, S., Akkari, A. et Macedo, B., « Au-delà du labyrinthe conceptuel: la notion de qualité en education », Recherche et prospective en éducation n° 02,‎ 2012, p. 17 (lire en ligne)

[13] (en) Unterhalter, E. et Brighouse, H., Distribution of what for social justice in education ? The case of Education for All, New York, Amartya Sen’s capability approach and social justice in educatio Palgrave Macmillan, 2007 (ISBN 978-0-230-60481-0, lire en ligne), p. 67 - 86

[14] UNESCO, Un guide pour assurer l'inclusion et l'équité dans l'éducation, Paris, UNESCO, 2017, 46 p. (ISBN 978-92-3-200135-1, lire en ligne)

[15] (en) Tobin, M., Lietz, P., Nugroho, D., Vivekanandan, R. et Nyamkhuu, T., Using large-scale assessments of students’ learning to inform education policy Insights from the Asia-Pacific region, Bangkok, ACER et UNESCO, 2015, 20 p. (ISBN 978-1-74286-296-5, lire en ligne)

[16] Nations Unies, L’Initiative mondiale pour l’éducation avant tout, Paris, Initiative mondiale du Secrétaire général de l’ONU pour l’éducation, 2012 - 2016, 36 p. (lire en ligne)

[17] (en) UNESCO, Managing tomorrow's digital skills: what conclusions can we draw from international comparative indicators?, Paris, UNESCO, 2018, 32 p. (lire en ligne)

[18] (en) Yasukawa, K., Hamilton, M. et Evans, J., « A comparative analysis of national media responses to the OECD Survey of Adult Skills: policy making from the global to the local? », Compare: a journal of comparative and international education, Vol. 47, No. 2,‎ 2017, p. 271-285 (DOI 10.1080/03057925.2016.1158644, lire en ligne)

[19] (en) Ferrer, G. et Fiszbein, A., « What has happened with learning assessment systems in Latin America? Lessons from the Last Decade of Experience », The Dialogue: Leadership for the Americas.Commission for quality education for all: background paper. Washington D.C., Banque mondiale.,‎ 2015 (lire en ligne)

[20] (en) Steiner-Khamsi, G., Appleton, M. et Vellani, S., « Understanding business interests in international large-scale student assessments: a media analysis of The Economist, Financial Times, and Wall Street Journal », Oxford Review of Education, Vol. 44, No. 2,‎ 2017, p. 190-203 (lire en ligne)

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]