L’évaluation dans la transformation publique : contre l’indifférence, la révolution permanente

Le 2 mai 2025

La relance du thème de l’évaluation des politiques publiques à la Direction interministérielle de la transformation publique (DITP) est un bon moment pour interroger la place de cette pratique au sein des stratégies de la transformation publique. Miracle ou mirage, nous avons donné la parole à Paul Cotton qui vient de soutenir une thèse qui étudie les raisons des échecs de l’institutionnalisation durable de l’évaluation en défendant l’idée d’une révolution permanente de cette dernière.

Une thèse pour comprendre la non-réactivation de l’évaluation comme outil d’amélioration de l’action publique

Lorsque l’on parle de transformation de l’action publique, deux images viennent en tête assez rapidement. D’un côté, une image classique, économique de la transformation publique, avec sa rationalisation souvent synonyme de coupes budgétaires tous azimuts soutenues par des exercices d’audit ou de revue des dépenses. De l’autre, une image plus moderne, celle de l’innovation publique, une exploration qui tente de convertir laborieusement l’administration à des pratiques quasi futuristes, telles que l’intelligence artificielle, les sciences comportementales, le design, la participation citoyenne.

Ma thèse explore une autre façon de penser la transformation de l’action publique qu’on a tendance à oublier. À la fois ni vraiment innovante, même si certains l’associaient il y a peu à une « petite évolution culturelle » 2, ni toujours mobilisée à bon escient pour produire des économies : l’évaluation des politiques publiques. Sur les quarante dernières années, l’évaluation est restée une démarche qui soutient de façon régulière un discours sur la réforme plus qu’elle ne produit de changement sur le temps long. J’ai donc cherché à comprendre pourquoi l’évaluation va et vient, alors qu’elle existe depuis au moins les années 1960 au niveau gouvernemental, les années 1990 au niveau des collectivités territoriales, et qu’elle a même un temps été envisagée comme la façon de réformer l’action publique, que ce soit dans le cadre du « Renouveau du service public » de Michel Rocard ou la « Modernisation de l’action publique » de Jean-Marc Ayrault.

Pour ce faire, j’ai été recruté comme chercheur sous contrat de convention industrielle de formation à la recherche (CIFRE) dans un cabinet de conseil spécialisé en évaluation : rien de mieux qu’être évaluateur pour comprendre l’évaluation. J’ai pris pour laboratoire d’étude des administrations qui ont déployé et parfois renoncé à l’évaluation (conseils régionaux, métropole, administrations ministérielles) entre 1990 et 2024. J’ai travaillé à partir d’une riche sélection d’archives administratives et rencontré près d’une centaine de personnes (hauts fonctionnaires, élus, consultants, chercheurs) qui ont accepté de partager leurs souvenirs de l’évaluation. Le tout, pour répondre donc à l’énigme de sa non-réactivation, que l’on peut résumer ainsi : pourquoi un régime démocratique qui inscrit l’évaluation dans sa Constitution n’a-t-il pas, en trente ans repris et pour de bon, pris le virage de l’évaluation ? Et plus encore, pourquoi des acteurs continuent-ils de la promouvoir avec conviction alors qu’elle semble reléguée aux marges des technologies de gouvernement ?

L’évaluation apparaît polarisée en deux répertoires cloisonnés

Le premier défi : identifier ce qui relève ou non de l’évaluation. La pratique a ceci de curieux qu’elle reflète une mosaïque de pratiques, entre recherches scientifiques et bricolage méthodologique, sans définition partagée. Si elle consiste à mesurer ou comprendre les mécanismes de production des effets d’une politique publique, plusieurs approches peuvent y parvenir. Certains évaluateurs insistent, par exemple, sur sa filiation avec l’analyse économique et la mesure d’impact, quand d’autres la revendiquent comme au service de la construction d’un récit partagé sur les politiques publiques, allant même jusqu’à la présenter comme un levier d’émancipation des citoyens. L’originalité de mon travail est de faire un pas de côté par rapport à ces définitions et aux controverses qu’elles véhiculent. J’ai choisi d’aborder l’évaluation comme un objet aux contours délibérément flous, où les ambitions affichées en termes de transformation servent de point de départ à l’analyse.

Poser un regard de sociologie politique sur l’engouement sans cesse renouvelé pour une pratique ayant pourtant maintes fois été reléguée dans les tiroirs des recettes de la réforme de l’action publique me conduit à dire que l’évaluation doit plutôt être comprise par ses marchés, à la fois au sens de la compétition économique mais aussi au sens d’une compétition entre différentes formes expertises. À partir d’une analyse de ces marchés, j’ai identifié deux mondes de l’évaluation, deux « répertoires » qui coexistent. La notion de répertoire croise des aspects internes à l’évaluation – tels que les méthodes employées et leurs justifications épistémologiques – avec leurs espaces de réception dans l’administration. Je dresse dans la thèse les contours de ces répertoires et en distingue deux idéaux types : « pluraliste-consultocrate » et « scientiste paragouvernemental ». Le premier prend corps autour d’une évaluation considérée comme un outil de dialogue et d’intermédiation entre les différentes parties prenantes d’une politique publique, dont l’association est cherchée dans l’évaluation (d’où le terme « pluraliste »). Il réactive le mythe de l’évaluation comme réponse à la crise démocratique, promu dès les années 1980 dans le rapport de Patrick Viveret3. Les méthodes employées découlent d’un guide méthodologique élaboré il y a plus d’une trentaine d’années par quelques chercheurs lyonnais qui ont ensuite créé leur cabinet-conseil. Si ce cabinet n’existe plus depuis, on retrouve une nébuleuse de petites structures du conseil et d’agents publics, principalement dans les collectivités territoriales, qui en sont les héritiers. Le second répertoire pose plutôt le principe d’une mesure incontestable des effets grâce au calcul économique et à ses variétés de méthodologies, comme la microsimulation. L’idée est d’ainsi pouvoir optimiser les choix de politiques publiques, d’une façon proche de celle déjà promue par la rationalisation des choix budgétaires dans les années 1960. À la différence des premiers, ses artisans, principalement des économistes dont certains sont directement intégrés dans des administrations chiffreuses, comme les services de statistiques ministériels, interviennent plus volontiers sur de l’évaluation-conception de politiques.

En retraçant l’histoire de ces deux répertoires entre 1990 et 2024, je me suis aperçu d’une étanchéité : leur maturation se passe dans des couloirs parallèles, sans que l’un ne prenne l’ascendant sur l’autre. Pour assurer leur existence et leur « survie » dans le marché des méthodes de transformation de l’action publique, les acteurs de chaque répertoire ont entrepris une stratégie de spécialisation et de différenciation, au détriment d’une union des évaluateurs. Par exemple, des cabinets de conseil « pure player » de l’évaluation cherchent à apparaître multi-positionnés en faisant le lien entre l’évaluation et d’autres démarches dans l’ère du temps, comme le design ou la participation citoyenne. D’où l’entretien d’un flou autour de la définition de l’évaluation, qui, s’il a pu s’avérer utile pour convertir plusieurs administrations à l’évaluation (les travaux du politiste Vincent Dubois ont bien montré que le flou permet l’ajustement), a aussi contribué à la rendre peu compréhensible et à entretenir dans la tête des décideurs des prénotions fausses à son sujet. Je pense, par exemple, à un élu pour qui l’évaluation consiste encore aujourd’hui à remplir des tableurs à longueur de journée, ou à un haut fonctionnaire qui considère que sans base de données l’évaluation n’est pas possible. Depuis la fin des années 2010, des ponts commencent à se dresser entre les tenants de l’un et l’autre des répertoires. Je pense aux travaux de l’Assemblée nationale conduits à partir de 20184 sous le label Printemps de l’évaluation ou, plus récemment, à certaines agences de l’État, comme l’ADEME qui mobilisent de plus en plus, dans leurs accords-cadres, des consortiums constitués de chercheurs en économie et d’évaluateurs pluralistes. Une recomposition du paysage de l’évaluation semble ainsi s’opérer à petits pas.

Abandonner l’idée du grand soir de l’évaluation : le développement et l’entretien de niches évaluatives

Les espaces de production des évaluations sont polarisés. Les pluralistes-consultocrates concentrent majoritairement leur activité au niveau les collectivités territoriales, premières commanditaires d’évaluations (et de loin : on parle ici de plusieurs milliers d’évaluations réalisées sur les quinze dernières années). Les scientistes paragouvernementaux ne sont pas positionnés sur ce marché et réalisent leurs évaluations au sein ou pour des administrations d’État, le tout en bien plus faible quantité. Il faut dire que les contraintes en termes d’accessibilité des données et souvent de transparence des résultats, notamment dans le cadre de publications scientifiques5, réduisent ses terrains de jeux potentiels. Dans tous les cas, je constate que l’évaluation n’est donc pas (plus) une affaire d’État. Quand bien même l’évaluation est mentionnée comme une activité constitutionnelle du Parlement ou de la Cour des comptes6, ces derniers représentent finalement une goutte d’eau dans la petite mare de l’évaluation.

Les évaluateurs disent souvent que, si l’évaluation ne prend pas, c’est en raison d’un manque de « culture de l’évaluation », notamment chez les élus. Certes, le politique joue un rôle déterminant, mais il n’est pas seul. Au lancement d’une évaluation, les ministres ou des élus, leurs cabinets et les responsables d’administration (par exemple, les directeurs généraux des services dans les collectivités) doivent accepter de perdre une partie de leur libre interprétation des effets des politiques publiques qu’ils déploient au profit du travail des évaluateurs. Ce travail peut être ensuite repris par l’opposition pour soutenir une critique politique.

Encore faut-il que les commanditaires jouent le jeu de la transparence, ce qui est loin d’être le cas dans beaucoup des évaluations que j’ai pu voir, y compris dans des administrations qui s’affichent pourtant comme exemplaires en la matière. Je montre que les évaluateurs ont aussi leur responsabilité dans la diffusion et surtout la survie (ou non) de l’évaluation dans les administrations. Or, ces derniers ont pour la plupart abandonné l’idée d’un grand soir de l’évaluation ou d’une « tour à la Défense d’évaluateurs » pour reprendre l’expression d’un enquêté, au profit de tours à défendre. Perdants du leadership réformateur, ces experts cultivent des niches où ils trouvent refuge, niches qu’ils participent à construite et à entretenir. Je pense, par exemple, à certaines méthodes d’évaluation qui deviennent des éléments de langage de la contestation légitime, comme la micro-simulation appliquée à la législation socio-fiscale. Sur d’autres terrains d’étude, je mets en évidence leur rôle d’instigateur de tendance ou de compagnon, notamment chez les consultants-évaluateurs, allant parfois au-delà de la seule production de rapports, dans l’intérêt de l’entretien du système évaluatif. Et l’initiative du développement de l’évaluation peut émaner directement des agents publics mis sur la voie de l’évaluation par des évaluateurs externes, avant que s’y joignent les élus. Ces niches peuvent parfois se fissurer par l’action des évaluateurs eux-mêmes, actions qui découlent de leur conception de l’évaluation. Je pense, par exemple, à des consultants attachés à l’indépendance de leur jugement ou à des chercheurs un peu trop gourmands sur l’usage des données. L’évaluation peut aussi s’éroder sous le poids de la concurrence d’autres pratiques, je pense notamment à l’administration chargée de la réforme l’État entre la fin des années 2000 et la première moitié des années 2010 qui a dû continuellement démontrer la plus-value de l’évaluation face à des inspections générales et des multinationales du conseil peu réceptives à l’idée de prendre le virage de l’évaluation.

Éclipse, mémoire et réactivation : une institutionnalisation en dehors de l’administration, prête à l’emploi

Finalement, à partir du cas de l’évaluation, ma thèse met en évidence deux enseignements qui la dépassent largement. Le premier est une invitation à étudier les ressorts de ce que j’appelle la consultocratie administrative, qui repose sur une alliance entre des fonctions supports dans l’administration et des prestataires externes, qu’ils soient chercheurs ou consultants.

Le second est de parler d’éclipse plutôt que de « mode » s’agissant des pratiques de transformation. Ni effacée ni complètement oubliée, l’évaluation renaît par cycles : un mécanisme de réactivation opère, guidé par la mémoire collective des praticiens, parfois plusieurs années après son apparent abandon de la pratique. En réalité, elle n’est que mise en sommeil, placée dans l’ombre, pour une durée plus ou moins longue. La remémoration est alors permise grâce à l’entretien d’une mémoire collective par les praticiens et leurs descendants, pour la plupart extérieurs à l’administration, prêts à réactiver leur arsenal méthodologique lorsque l’opportunité se présente et à l’ajuster pour le faire correspondre aux visions réformatrices du moment – visions qu’ils participent pour certains à structurer. L’éclipse se produit aussi à l’échelle individuelle, les détracteurs d’hier pouvant être les promoteurs d’aujourd’hui, et les tenants d’autres pratiques de transformation peuvent aussi se mettre à redécouvrir l’évaluation des politiques publiques et à la promouvoir7. Et si le véritable défi n’était pas d’inventer de nouvelles recettes, mais de dépoussiérer ces vieux livres de cuisine qui patientent sur l’étagère ?

  1. Auteur de la thèse Les « perdants magnifiques » de la réforme de l’action publique. Entre marché et administrations, la révolution permanente des répertoires d’évaluation des politiques publiques en France (1990-2024), soutenue le 7 janvier 2025, sous la direction de Gilles Pollet, professeur de science politique, Sciences Po Lyon, laboratoire Triangle (UMR5206).
  2. Chaigneau C., « “L’évaluation des politiques publiques, c’est une petite révolution culturelle” (Pierre Moscovici) », objectif-languedoc-roussillon.latribune.fr 22 juin 2022.
  3. Viveret P., L’évaluation des politiques publiques et des actions publiques, rapp., 1989, La documentation française.
  4. Assemblée nationale, Évaluation des dispositifs d’évaluation des politiques publiques, rapp. inf., 15 mars 2018, no 771.
  5. Voir, par exemple, la charte de déontologie : https://www.ipp.eu/actualites/charte-de-deontologie-commune-idep-ipp-liepp/
  6. La révision constitutionnelle du 23 juillet 2008 ajoute une fonction d’évaluation au Parlement (Const., art. 24) et peut, pour ce faire, bénéficier de l’assistance de la Cour des comptes (Const., art. 47-2).
  7. https://www.la27eregion.fr/innovation-publique-et-si-on-depliait-levaluation/
×

A lire aussi