Revue
Grand entretienSamuel Göeta : «Il y a aujourd’hui un open data à deux vitesses»
Sociologue, maître de conférences associé à Sciences Po Aix et spécialiste de l’open data, Samuel Goëta a publié, en février 2024, Les données de la démocratie. Open data, pouvoirs et contre-pouvoirs1. Co-fondateur de la société coopérative Datactivist, où il accompagne les projets d’ouverture de données, il a aussi participé, en 2012, à la création de l’association Open Knowledge France, qui anime le site Madata.fr, destiné à faciliter l’usage citoyen du droit d’accès aux documents administratifs.
Apparu il y a une vingtaine d’années dans les sciences, le mouvement de l’open data promeut le libre usage des données, matière première de l’information. « L’open data fait vivre la démocratie » est la conviction qui anime Samuel Goëta, « militant de la première heure de ce mouvement », comme l’écrit Axelle Lemaire, secrétaire d’État en charge du numérique et de l’innovation entre 2014 et 2017 et à l’origine de la loi pour une République numérique2, dans la préface Des données de la démocratie. Open data, pouvoirs et contre-pouvoirs.
BIO EXPRESS
2012Co-fondateur de l’association Open Knowledge France
2016Docteur en sociologie à Télécom ParisTech
2016Co-fondateur de la coopérative Datactivist
2020Maître de conférence associé en sociologie à Sciences Po Aix
2024Auteur du livre Les données de la démocratie. Open data, pouvoirs et contre-pouvoirs
Comment se situe la France en matière d’ouverture des données ?
Ce que je constate, c’est que l’open data a contribué à favoriser la diffusion de la culture des données dans les administrations et les collectivités territoriales.
En vingt ans, ce mouvement, qui promeut le libre usage des données, a été un levier de culture numérique dans le secteur public.
Nous oublions souvent de dire que la première de toutes les start-up d’État, c’est Data.gouv.fr, la plateforme ouverte des données publiques françaises. Data.gouv.fr est un succès à plein d’égards, avec des fonctionnalités communautaires qu’on ne retrouve dans aucun autre pays. Il y a aussi la structuration unique au monde avec l’association OpenDataFrance qui fédère et accompagne les collectivités locales dans leur projet d’ouverture des données. Elle est composée de collectivités territoriales et de membres partenaires (Etalab, Fondation Internet nouvelle génération [FING], LiberTIC, etc.) L’incubateur de start-up d’État Beta.gouv.fr est en partie né de l’expérience de l’open data. Toutefois, en réalité, ce qu’on constate plus largement est que cela a permis une plus grande acculturation aux données, que ce soit dans les territoires ou dans l’État central.
Aujourd’hui, des initiatives d’open data essaiment grâce à la diffusion de la culture de la donnée formant des communautés dynamiques. Je pense, par exemple, à Open Food Facts, la base de données libre sur les produits alimentaires ; OpenStreetMap, un projet collaboratif de cartographie en ligne qui vise à constituer une base de données géographiques libre du monde, en utilisant le système GPS et d’autres données libres ; Opendatasoft, une plateforme créée par d’anciens responsables de l’open data de l’État français ; ou encore namR qui vise à utiliser les données pour évaluer le potentiel de décarbonation et d’adaptation climatique du patrimoine immobilier. Il y a aujourd’hui un écosystème qui est donc très vif, à la fois au niveau territorial et au niveau national, et des communautés qui font vivre et pérennisent l’open data.
En vingt ans, l’open data a fait du chemin dans les administrations. La fonction de chief data officer est maintenant dans chaque ministère grâce à la création du réseau des administrateurs ministériels des données, des algorithmes et des codes sources (AMDAC), chargés de définir la stratégie d’ouverture des données des ministères, et l’initiative d’ouvrir les données des marchés publics.
La culture numérique s’est répandue dans les grandes villes françaises comme Paris, Rennes, Lille, Nantes, Lyon ou encore Bordeaux. Avec la diffusion de la culture de l’open data, les collectivités ont commencé à s’intéresser et à mettre en place des stratégies d’usages des données et à élargir leur gouvernance. Plus largement, l’open data incite à repenser le rapport qu’à la collectivité, avec ses prestataires, avec les acteurs du territoire qui collectent des données et dans les démarches de service public de la donnée. Il y a aussi l’idée qu’on puisse obtenir et faire circuler les données qui viennent des acteurs privés vers le public.
Malgré ces avancées, il y a encore beaucoup de choses à faire sur la transparence et l’ouverture des données. Je pense notamment à ce que les Anglo-saxons appellent l’« open government », le « gouvernement ouvert ». C’est une pratique inspirée de l’administration Obama qui visait à créer un niveau sans précédent de transparence et d’ouverture du Gouvernement. La France fait partie, depuis 2014, du partenariat pour un gouvernement ouvert (PGO), une structure internationale qui regroupe 75 États membres et 106 gouvernements locaux. Elle a élaboré plusieurs plans d’action, le quatrième vient tout juste d’être adopté au début 20243. Malgré les intentions et les engagements, cette initiative a du mal à prendre. Des associations de défense des libertés numériques, comme la Quadrature du Net, la Ligue des droits de l’Homme, l’April ou encore Framasoft regrettent encore trop d’opacité sur les décisions gouvernementales. C’est clairement un chantier à améliorer !
En vingt ans, l’open data a fait du chemin dans les administrations. La fonction de chief data officer est maintenant dans chaque ministère grâce à la création du réseau des administrateurs ministériels des données, des algorithmes et des codes sources (AMDAC).
Sommes-nous aujourd’hui entrés dans la maturité en matière d’open data ? Comment expliquer ces difficultés des administrations à ouvrir leurs données ?
L’open data est un vecteur essentiel de la transformation des administrations. Pourtant, seulement 728 sur 4 500 collectivités concernées par l’obligation légale de la loi Lemaire ont ouvert des données en décembre 2022, soit 16 % des collectivités locales. L’obligation d’ouverture des données est arrivée au moment de la mise en œuvre du règlement général sur la protection des données (RGPD). Plus largement, beaucoup d’agents veulent s’engager dans l’ouverture des données, mais ont du mal à porter leurs initiatives auprès de leur hiérarchie. L’un des problèmes récurrents de l’open data que j’ai pu observer est que les collectivités ne savent pas qui sont leurs usagers. Selon moi, il y a un open data à deux vitesses : d’un côté, les données qui favorisent l’innovation et qui sont soutenues, et, de l’autre, un open data qui pourrait remettre en cause l’ordre établi, les politiques publiques et les décisions politiques, et qui manquent de soutien des pouvoirs publics.
Justement, comment faire pour obtenir les données qui ne sont pas disponibles ou difficiles d’accès ? Quelles sont les stratégies possibles que peuvent mettre en place les acteurs de la société civile ou les collectivités locales ?
Dans mon livre, je consacre un chapitre à ce sujet en préconisant cinq stratégies alternatives pour obtenir des données. La première stratégie passe par la voie réglementaire en ayant recours au droit d’accès à l’information publique. Même si nous en avons vu précédemment les limites, le cadre juridique français peut permettre d’obtenir des données pertinentes à quiconque a connaissance du droit et sait se montrer persévérant. Autre option : aspirer les données présentes sur les sites Internet en ayant recours au scraping. Cette méthode repose souvent sur un assemblage incertain et demande des ajustements réguliers pour que les robots parviennent à extraire en continu les éléments pertinents des pages web. Si l’administration ne produit pas ces données, ne les expose pas ou refuse catégoriquement de les libérer sous une forme structurée, il est souvent possible d’arriver à les reconstituer par cette méthode quand les données sont présentées sur un site web institutionnel.
La troisième méthode consiste à constituer une base de données en rapprochant des sources éparses (presse, rapports officiels, récits, publications sur les réseaux sociaux, etc.). Elle repose généralement sur un travail manuel et fastidieux de compilation, d’analyse et de déduplication. Pour cette quatrième méthode, je pense au travail de collecte du journaliste David Dufresnes sur les dérives du maintien de l’ordre4, ou du professeur d’histoire-géographie, Mathieu Lépine, qui recense, depuis 2019, les accidents mortels au travail. Dans certains cas, l’effort de collecte des données se révèle trop important pour une personne ou une équipe. Il est alors possible d’avoir recours à la mobilisation d’une foule de contributeurs pour constituer ensemble une base de données exploitables. Enfin, la cinquième stratégie consiste à créer un commun de données, gouverné par les personnes concernées qui ont apporté les données. Dans le domaine des sciences du vivant, Tela Botanica, le plus important réseau de botanistes professionnels et amateurs en langue française, ou encore OpenStreetMap, évoquée précédemment, devenu une base de données géographiques mondiale.
Selon moi, il y a un open data à deux vitesses : d’un côté, les données qui favorisent l’innovation et qui sont soutenues, et, de l’autre, un open data qui pourrait remettre en cause l’ordre établi, les politiques publiques et les décisions politiques, et qui manquent de soutien des pouvoirs publics.
Approfondir et étendre la démocratie5
Si j’ai écrit ce livre, c’est parce que je crois en la démocratie et que je suis convaincu que l’ouverture des données peut l’approfondir. En pratique, les expériences d’open data – du moins en France –, ont mené à un bilan contrasté comme nous avons pu le constater tout au long de ce livre. L’ouverture des données n’est pas parvenue à pallier les faiblesses du cadre juridique et administratif de la transparence publique pour réduire les asymétries d’information entre l’administration et les citoyens. La qualité et la fiabilité des données ouvertes pour nourrir le débat démocratique reste encore un chantier important. Des fractures territoriales majeures subsistent et des pans entiers de l’action publique n’ont pas intégré leur obligation d’ouverture. Face aux carences des données ouvertes, les citoyens doivent souvent faire preuve de ténacité en exerçant avec patience le droit d’accès aux documents administratifs, en ayant recours au scraping, en reconstituant les données ou en faisant appel à une foule de contributeurs (crowdsourcing).
Ce bilan détonne avec les classements internationaux en matière d’open data qui placent la France en tête des pays en matière d’ouverture des données, en Europe et dans le monde. Il y a eu des progrès considérables en matière d’open data en France depuis plus d’une décennie, retracés dans ce livre. Une agence comme Météo France, longtemps considérée comme un bastion imprenable pour l’open data, ouvre ses données au moment où j’écris ces lignes avec le lancement de Meteo.data.gouv.fr. L’écosystème public et privé en France en matière d’open data est parmi les plus dynamiques. Les fonctionnalités et l’activité d’unportail comme Data.gouv.fr feraient rêver les passionnés de données dans la plupart des pays du monde. Ces avancées sont dues à un petit nombre de personnes engagées, rarement soutenues par leur hiérarchie, qui défendent l’ouverture des données comme une conclusion logique des principes du service public et un moyen concret de faire avancer la démocratie. Très souvent en dehors de leurs missions officielles, ces personnes font vivre l’open data en France en soutenant des décisions politiques favorables à l’ouverture des données, en publiant ou en mettant à jour des données, en maintenant des circuits fragiles de publication, en acculturant le public interne ou externe à ces enjeux ou encore en produisant des services pour rendre ces données intelligibles par le plus grand nombre.
Cet écosystème est fragile, il repose sur les volontés et l’énergie de peu de personnes. C’est le sens de la couverture de ce livre représentant une abeille et la pollinisation, qui symbolise la diversité des données, leur importance pour la vie démocratique mais rappelle aussi la fragilité de cet écosystème. Cette fragilité se ressent d’autant plus lorsqu’on s’intéresse aux données qui peuvent nourrir le débat démocratique ou servir aux contre-pouvoirs. Les demandes d’accès aux données peinent à aboutir, les données sont souvent manquantes ou ne disposent pas d’un niveau de détail suffisant. Ce n’est pas surprenant si on observe l’état de la démocratie en France où, depuis plus d’une décennie, le dialogue avec la société civile est dégradé et certains droits fondamentaux comme la liberté d’association ou de manifestation sont régulièrement mis à l’épreuve. Un autre classement le reflète, celui de l’état de la démocratie dans le monde établi par le magazine The Economist, qui classe régulièrement la France parmi les démocraties « défaillantes ».
Les chantiers et les pistes d’actions présentés dans le dernier chapitre pour obtenir les données qui manquent, améliorer la qualité et la fiabilité des données et développer la culture des données peuvent contribuer à renforcer la démocratie. Non que la transparence serait une chose bonne en soi, mais parce qu’elle est une des conditions de la santé du débat démocratique et de l’exercice des droits fondamentaux. Je pense que l’open data peut permettre d’approfondir la démocratie mais aussi de revenir à ses fondamentaux. Comme je l’ai évoqué à plusieurs reprises, l’ouverture des données s’appuie sur des fondations anciennes, en particulier la Déclaration des droits de l’homme et du citoyen qui stipule dans son article que « la Société a le droit de demander compte à tout agent de son administration ». Cet article a posé les bases d’un principe de reddition des comptes (souvent désigné par le mot anglais « accountability ») qui a favorisé l’émergence du droit d’accès aux documents administratifs. On a pu voir à travers ces pages que ce droit, devenu la norme en démocratie et reconnu à valeur constitutionnelle depuis en France, est malmené. Peu connu des citoyens, souvent contourné par les administrations, pas véritablement effectif, il peine à agir comme un contre-pouvoir. Dans ce contexte, j’ai tenté de montrer que le mouvement de l’ouverture des données peut aller bien au-delà de ses promesses de renouvellement de la transparence, de foisonnement de l’innovation et de transformation de l’administration. L’open data peut approfondir la démocratie elle-même.
Avec le principe d’ouverture des données par défaut, aujourd’hui entré dans la loi, l’administration a le devoir de rendre des comptes à la société en publiant des données. L’administration passe d’une logique réactive, par laquelle elle répond aux demandes des citoyens, à une logique proactive où elle publie les données par principe, sans attendre une demande. Dans une époque où chacun peut accéder aux données, les comprendre et les utiliser (notamment si la médiation des données se développe), l’insistance sur les données, et non plus seulement les documents, va au-delà d’une adaptation de la démocratie à son environnement sociotechnique. Je pense que c’est également un retour à l’essence de l’article de la Déclaration des droits de l’homme et du citoyen (DDHC) qui donne le droit à la société de demander des « comptes ». […] Il témoigne d’une logique financière et comptable de la transparence dans laquelle la possibilité de retrouver les documents justificatifs de la décision et de refaire les calculs sont essentiels à ce que la souveraineté populaire soit respectée. Cette association de la reddition des comptes au calcul se matérialise dans l’architecture du palais Cambon. C’est dans ce palais parisien dans lequel siège la Cour des comptes que l’on peut accéder à la grande chambre qui expose l’article de la DDHC gravé dans le marbre entre deux colonnes ornées des allégories de la Connaissance et de la Justice. La symbolique est forte. Il faut, de plus, passer par la galerie Philippe Séguin dont le plafond est décoré d’une fresque de l’artiste contemporain Bernar Venet composée de nombres et d’équations. Accéder aux données dans leur forte précision, c’est permettre à chacun de vérifier les calculs. C’est d’autant plus nécessaire à une époque dans laquelle chacun cherche à se parer de l’objectivité présumée de la quantification et où le débat public se réduit souvent à une bataille de chiffres dont il est souvent difficile de contrôler la provenance et la véracité.
- Goëta S., Les données de la démocratie. Open data, pouvoirs et contre-pouvoirs, 2024, C&F Éditions.
- L. no 2016-1321, 7 oct. 2016, pour une République numérique, dite « loi Lemaire ».
- Conçu et implémenté sous l’autorité du ministère du Renouveau démocratique, le quatrième plan d’action a été présenté le 27 mars 2024 (https://www.modernisation.gouv.fr/outils-et-formations/le-plan-daction-national-2024-2026-pour-un-gouvernement-ouvert).
- Un travail qui a donné lieu à la réalisation d’un documentaire intitulé « Un pays qui se tient sage », en 2020.
- Goëta S., Les données de la démocratie. Open data, pouvoirs et contre-pouvoirs, op. cit., p. 256-259.