Revue

Dossier

Quand le big data se met au service des quartiers

Les zones les plus fragiles et les plus exposées à la maladie ne sont pas toutes classées en zones de la politique de la ville, mais tous les quartiers QPV sont des zones fragiles.
©RésO Villes
Le 1 février 2021

Depuis 2019, l’association RésO Villes pilote le programme « Data et quartiers » en Bretagne et Pays de la Loire, avec le soutien de l’Agence nationale de la cohésion des territoires (ANCT), dont l’objectif est d’expérimenter de nouveaux outils et de nouveaux usages de la donnée dans les quartiers de la politique de la ville. Un dispositif unique en France qui vise aussi à doter les acteurs des quartiers d’une culture de la donnée utile à la conduite de leurs missions. Durant la crise sanitaire, l’association a réalisé une cartographie de la fragilité des quartiers face au covid-19 et livre les détails de ce projet pour la première fois dans cet article.

Résumé

Le centre de ressources pour la politique RésO Villes est une association loi 1901 qui intervient auprès de 32 communes des régions Bretagne et Pays de la Loire regroupant sur leur sol 78 quartiers « politique de la ville ». RésO Villes accompagne les communes, les associations et les différents acteurs locaux qui interviennent dans les quartiers et contribue au débat public à travers une réflexion politique, économique et sociale sur l’avenir de ces territoires fragilisés.

Depuis 2019, RésO Villes pilote le programme « Data & quartiers » qui vise à expérimenter de nouveaux outils et de nouveaux usages de la donnée que l’on retrouve plus fréquemment déployés dans les quartiers centraux au titre des projets de « ville intelligente ».

Soutenu par l’ANCT, par des partenaires publics locaux et par quelques grandes entreprises, ce projet a, avant tout, une vocation pédagogique : il vise à doter les acteurs des quartiers d’une culture de la donnée utile à la conduite de leurs missions. Durant la crise sanitaire, l’association a réalisé une cartographie de la fragilité des quartiers face au covid-19 et livre les détails de ce projet pour la première fois dans cet article.

Inventés le plus souvent à d’autres fins, notamment commerciales, ces outils de modélisation peuvent s’avérer des alliés précieux pour les agents publics dont le métier consiste à observer et comprendre les territoires avant d’y déployer des politiques publiques.

Le programme « Data & quartiers »

L’idée du programme « Data & quartiers » est née fin 2016 d’un constat sévère : dans toutes les métropoles françaises, les projets et les prototypes de smart city ou de « ville intelligente » se déploient systématiquement à partir des communes centres, et plus précisément de leurs propres quartiers centraux. La même année, la Caisse des dépôts et des consignations publiait le rapport Smart city vs stupid village1 qui posait brutalement une question : ces innovations sont-elles réservées aux territoires les plus riches ? Les communes modestes, notamment dans le monde rural, en seront-elles tenues à l’écart ?

Ne pas laisser la smart city aux quartiers des centres urbains

Centre de ressources pour la politique de la ville couvrant les régions Bretagne et Pays de la Loire, l’association RésO Villes a posé une question complémentaire : qu’en sera-t-il des quartiers périphériques ? Resteront-ils à l’écart de ces projets dits « intelligents », dont on annonçait déjà qu’ils allaient permettre d’améliorer l’efficacité du service public, de personnaliser et d’adapter ces services aux besoins de chacun grâce aux data ?

La question était d’autant plus importante que la politique de la ville s’est construite depuis plus de quarante ans sur l’exploitation de nombreuses données.

Les outils d’observation sont nombreux. Les indicateurs et les critères de classement des quartiers en zones éligibles reposent sur des données. Mais qu’en est-il de l’usage des nouvelles données, dites « massives », et donc des outils du big data en dehors des quartiers prototypes de la « ville intelligente » ? Et est-ce que ces nouveaux outils peuvent être utiles aux acteurs qui œuvrent au quotidien auprès des habitants des quartiers prioritaires de la politique de la ville (QPV) ?

En juin 2018 à Rennes, à l’occasion du forum « Cités Cap », l’association a testé une idée auprès des acteurs des quartiers. Élus locaux, cadres associatifs ou représentants des habitants, ils ont été invités à prendre part à un atelier intitulé « Le big data au service des quartiers » au cours duquel plusieurs prototypes ont été présentés. Il y avait notamment un outil algorithmique de modélisation prédictive des parcours des bénéficiaires du revenu de solidarité active (RSA) testé par le conseil départemental du Finistère à partir de données massives et d’open data. Il y avait aussi un outil d’analyse du marché de l’emploi développé par la société Randstad permettant une analyse automatisée des offres d’emploi et segmentée à l’échelle de certains quartiers. Le public d’experts et les acteurs du terrain avaient alors encouragé l’idée d’une expérimentation inscrite dans la durée et permettant aux professionnels comme aux habitants intéressés de s’initier aux nouveaux usages et aux nouveaux outils de la donnée. Dans les quartiers aussi, ces outils « intelligents » avaient leur place ! Tel était en tout cas le credo du conseil d’administration de l’association RésO Villes, composé d’élus locaux et présidé par Isabelle Melscoët adjointe au maire de Brest. Les quartiers cumulent déjà de nombreux retards, il ne fallait pas que ce soit le cas une nouvelle fois. Les membres du conseil d’administration seront d’ailleurs très vite les cobayes d’une demi-journée de formation et d’acculturation à la data au service de l’action publique locale.

Un programme soutenu par l’ANCT

Quelques mois plus tard, l’Agence nationale de la cohésion des territoires (ANCT) s’est engagée à soutenir le programme « Data & quartiers » pour une durée de trois ans faisant ainsi le choix de l’inscrire sur un temps long. On notera avec intérêt que ce choix est à l’opposé des habitudes des projets « smart » pour lesquels il est souvent fait appel à des méthodes de prototypage et d’expérimentation rapides : parfois quelques jours (pour l’exploitation de données dans des « hackathons »), quelques semaines (pour tester des capteurs et des objets connectés), au mieux quelques mois. Mais l’objectif du programme présenté par RésO Villes n’est pas de faire des POC2, il est d’accompagner les acteurs des quartiers.

Le premier objectif du programme est en effet de sensibiliser, à travers des usages concrets, différents publics à l’utilisation de solutions de datascience pour l’intérêt général. Inventés le plus souvent à d’autres fins, notamment commerciales, ces outils de modélisation peuvent s’avérer des alliés précieux pour les agents publics dont le métier consiste à observer et comprendre les territoires avant d’y déployer des politiques publiques.

Le second objectif du programme est de comprendre et de documenter la façon dont des projets de datascience peuvent se concevoir. Il a été décidé de les déployer en conservant la trace de chaque étape. L’idée est simple : plutôt que de rechercher un effet « waouh ! » RésO Villes cherche… un effet reproductible ! L’intégralité des méthodologies d’expérimentation est documentée et sera rendue publique dans la dernière année du programme pour que les équipes municipales, les experts et les associations qui travaillent en lien avec les quartiers puissent reproduire ces travaux et en engager d’autres.

Trois axes de travail : la santé, l’emploi et la mobilité

Mais pour construire cette démarche il faut des projets concrets. Avec l’ensemble des partenaires qui ont rejoint le programme (voir encadré p. 75), l’association a retenu trois thèmes prioritaires : la santé, l’emploi et la mobilité. Ils correspondent à des enjeux majeurs, pour lesquels des analyses intégrant des données massives sont susceptibles d’améliorer la compréhension et la connaissance des acteurs publics tant sur la réalité du quotidien des habitants, que sur leurs besoins et leurs attentes. Ils ont été identifiés lors d’une phase d’amorçage du projet, à l’issue d’une trentaine d’entretiens avec des élus locaux et différents organismes qui travaillent au quotidien dans les QPV.

Pour chaque thème, un groupe de travail a été constitué. Celui sur l’emploi s’est fixé comme objectif d’étudier la distance entre les lieux d’habitation et les emplois à pourvoir dans des entreprises pour l’ensemble des métiers recherchés par les habitants des quartiers. Les données utiles à la résolution de cette problématique sont nombreuses. Elles ne sont pas nécessairement simples d’accès. Un partenariat a été construit pour l’occasion avec Pôle emploi. Identifier les métiers le plus recherchés par les habitants suppose d’accéder aux déclarations effectuées lors des premiers entretiens avec des agents de Pôle emploi. Bien sûr, ces données doivent être anonymisées. Le croisement avec les données des offres d’emploi à pourvoir n’est pas simple non plus. RésO Villes a sollicité pour en faire l’analyse automatisée les équipes de datascientists de la société Randstad, partenaire du projet. L’objectif final est de mettre en main des acteurs des quartiers un outil cartographique simple bien que présentant des données complexes et massives et comportant des mises à jour en temps réel.

Dans une même logique, le groupe de travail sur la santé cherche à modéliser et à expliquer le non-recours à la complémentaire santé solidaire (anciennement CMU-C) par les habitants de quelques quartiers classés en politique de la ville. La nature des données à collecter est plus sensible que pour l’emploi puisqu’il s’agit pour une part de données de santé dont la protection, et c’est heureux, relève de règles très strictes. Ce travail a été un temps suspendu par la crise sanitaire car de nombreux partenaires, notamment les Agences régionales de santé, ont été extrêmement mobilisés. Mais nous allons voir que le programme « Data & quartiers » s’est penché sur la question de la fragilité des populations face au covid-19.

Les travaux du groupe « mobilité » démarrent quant à eux début 2021.

La méthode

Accompagnées par le cabinet CIVITEO, les équipes de RésO Villes ont construit une méthodologie pas à pas pour guider les travaux des groupes. Cette méthodologie s’inspire des règles usuelles de conduite de projets de big data ou de datascience mais elle est très séquencée de sorte à faciliter la documentation de l’ensemble du processus et de sorte à laisser une large place à l’échange et au partage des savoir-faire entre des acteurs qui ont un niveau d’expertise ou même de connaissance très variable des enjeux autour de la donnée.

Chaque projet débute par une phase de sensibilisation et d’acculturation à la data (ce que les anglo-saxons appellent le data mindset). Ce temps préparatoire est l’occasion d’explorer de nombreux enjeux. Ils sont juridiques et portent notamment sur la protection des données personnelles, la conformité au RGPD3, les règles du secret statistique, les outils d’anonymisation ou de pseudonymisation. Ils sont aussi techniques, économiques voire politiques. Une seconde étape consiste à définir des objectifs précis. Il est relativement aisé de faire des listes de données que l’on aimerait pouvoir consulter, il est plus difficile de construire une problématique d’étude. Lorsque l’objectif est connu, commence l’exploration des données. Il faut identifier celles qui existent et qui sont accessibles, par exemple, en open data ; celles qui existent mais dont l’accès semble difficile, voire impossible car coûteux ou protégé ou encore propriété d’acteurs que l’on connaît mal ; celles que l’on aimerait avoir, sans savoir si elles existent parce qu’on souhaite en disposer à une certaine échelle, à une granularité spécifique ou avec une temporalité de mise à jour qui semble impossible. Cette étape est cruciale car l’accès à des données nouvelles ou simplement inusitées peut être à l’origine de résultats vraiment inédits.

Interviennent alors les professionnels de la donnée, spécialistes de leur préparation et de leur traitement et programmateurs d’algorithmes. Ils ont en charge la réalisation d’un premier prototype pour vérifier, avec quelques données déjà disponibles, si les analyses attendues sont possibles. Alors seulement, la collecte massive va être engagée, en nouant si besoin des partenariats pour permettre le transfert des données, avec le cas échéant des conventions particulières quant aux usages autorisés ou prohibés ou quant aux droits et à la propriété intellectuelle qui peuvent leur être attachés. Le droit de la data est une matière juridique très neuve et RésO Villes a privilégié pour son programme des partenariats simples entre acteurs animés d’une volonté commune de faire avancer le projet. Pour autant, les équipes ont pu faire le constat que l’accès aux données est une phase délicate et chronophage, parfois dissuasive.

La dernière étape est celle de la réalisation des travaux de datascience. Si la puissance de calcul mobilisée et la rapidité avec laquelle les premiers résultats sont produits impressionnent le béotien, la démarche peut prendre du temps. Des restitutions intermédiaires sont nécessaires pour identifier la façon dont les modèles analytiques fonctionnent, pour vérifier que les données utilisées ne produisent pas des biais. Le recours à des algorithmes, a fortiori si certains sont dotés d’une part d’intelligence artificielle, nécessite des temps d’explication et des itérations parfois plus longues et plus complexes que lors de l’utilisation d’outils d’observation et de statistiques classiques.

Enfin, le programme « Data & quartiers » intègre des étapes de restitution. Des séquences de formation ont déjà eu lieu dans d’autres régions et des webinaires ont été organisés par l’ANCT. Des rencontres dans les quartiers sont programmées. Un livre blanc clôturera le programme fin 2021. Pour Horizons Publics, RésO Villes propose aussi une synthèse d’une étude inédite, publiée en novembre 2020 sur la fragilité des quartiers face à la contamination au covid-19.

Covid, quartiers populaires et données de santé

Depuis le début de la pandémie, de nombreuses études nationales et internationales ont démontré que certains facteurs sociaux et sanitaires cumulés pouvaient induire un risque de contamination plus élevé au covid-19 (ou un risque accru de développer une forme grave de la maladie)4. RésO Villes a souhaité vérifier à son échelle l’existence de ces facteurs de risque dans les quartiers de la politique de la ville. Pour construire cette analyse, l’idée était d’agréger à l’échelle des quartiers des données de sources multiples (Insee, Caisses d’assurance maladie, Agences régionales de santé, etc.) et de les présenter sous la forme d’une cartographie révélant les zones dites « à risques » selon les modèles des études scientifiques publiées. L’étude a été conduite pour toutes les communes de la région Bretagne ayant des quartiers prioritaires de la politique de la ville : Auray, Brest, Concarneau, Lannion, Lorient, Quimper, Rennes, Saint-Brieuc, Saint-Malo et Vannes.

Le travail a été conduit en deux étapes. Il a d’abord fallu construire des indicateurs de risque fiables. L’équipe, secondée par le cabinet CIVITEO et l’entreprise de datascience Valoway, a retenu quelques facteurs parmi ceux révélés par les chercheurs. Un indicateur sanitaire a ainsi été construit en intégrant la fréquence de pathologies de type diabète ou asthme chez les habitants (ou plus précisément le nombre de traitements délivrés), ou encore le nombre d’habitants souffrant d’une ou de plusieurs affections de longue durée. Un indicateur social renvoi, pour sa part, aux conditions de vie des habitants des quartiers à travers l’identification du nombre de personnes bénéficiaires de la CMU-C, du taux de population vivant en logement HLM ou encore du taux de population immigrée (une donnée sensible qui est fournie par l’Insee et utilisée notamment pour tester des hypothèses de corrélation entre un phénomène social et l’immigration).

L’idée posée sur le papier, le projet n’était guère plus avancé. Certaines données étaient facilement accessibles car publiées en open data par l’Insee. Mais toutes n’étaient pas accessibles à la bonne maille, c’est-à-dire à une échelle suffisante pour isoler des caractéristiques qui sont celles des quartiers QPV. Finalement, l’ensemble de l’analyse et la construction de la datavisualisation seront ramenés à l’échelle des IRIS. L’accès aux données sanitaires n’a pas été simple non plus. Et c’est sans doute une bonne chose. Des échanges ont eu lieu à plusieurs niveaux, y compris avec le Health Data Hub, l’organisme public créé en France en 2019 pour veiller (avec le concours de la CNIL) sur l’utilisation faite de nos données de santé. Par l’entremise de l’observatoire régional de santé de Bretagne de nombreux jeux de données ont été transmis à RésO Villes. Tous étaient rigoureusement anonymisés. Il restait à en faire l’agrégation et à rendre l’outil accessible.

Les enseignements tirés par RésO Villes de cette expérience à la fois improvisée et imposée par les circonstances au cœur de son programme « Data & quartiers » sont multiples. D’abord sur le fond, les zones les plus fragiles et les plus exposées à la maladie ne sont pas toutes classées en zones de la politique de la ville, mais tous les quartiers QPV sont des zones fragiles (voir infographie ci-dessous). Ensuite sur la méthode, cette expérience a montré que pour construire un outil au service des politiques publique il est possible d’aller chercher des données très utiles auprès de partenaires que l’on ne sait pas ou que l’on n’imagine pas pouvoir mobiliser. Pourtant les uns et les autres se connaissent. Ils se côtoient. Ils produisent ensemble des études et des bilans. Mais ils ne partagent pas leurs données.

Le programme « Data & quartiers » 5 a été imaginé aussi pour cela : diffuser une véritable culture de la donnée entre acteurs afin de créer à l’échelle des territoires de l’action publique les conditions d’un cadre de partage, éthique et en confiance, de la donnée.

Pour aller plus loin

La cartographie et les données de cette étude sont consultables sur le site internet de RésO Villes : https://www.resovilles.com/fragilite-des-populations-face-au-covid-19/

 

  1. Caisse de dépôts et consignations, Smart city versus stupid village, 2016.
  2. Prouf of concept, ou preuve de concept, terme très utilisé pour désigner des prototypes numériques.
  3. Règlement général européen pour la protection des données personnelles, entré en vigueur le 25 mai 2018.
  4. Voir notamment l’étude de l’INSERM, https://presse.inserm.fr/premiers-resultats-des-enquetes-de-sante-publique-de-linserm-sur-la-covid-19-facteurs-de-risque-individuels-et-sociaux/41032/
  5. Le programme est piloté par RésO Villes en Bretagne et Pays de la Loire bénéficie du soutien et de la participation de : l’Agence nationale de la cohésion des territoires ; les ARS de Bretagne et des Pays de la Loire ; la communauté d’agglomération de Saint-Nazaire (CARENE) ; Brest métropole ; le cabinet CIVITEO ; Harmonie mutuelle ; KPMG France ; Le Mans métropole ; Nantes métropole ; Pôle emploi ; Randstad et Valoway.

 

×

A lire aussi