DataSud, Open Data  |   Publié le 21 septembre 2020

Visualisation des indicateurs de la qualité de l’air

Le réchauffement climatique a tendance à renforcer les épisodes de pollution de l’air, responsables de 10 % des émissions de gaz à effet de serre de la France.
Les interactions entre météo, climat et pollution sont permanentes et complexes, ce qui nécessite une vigilance permanente.
Avec le développement de nos territoires (urbanisation, mobilité, mode de vie résidentiel…) la pollution de l’air est devenue un enjeu sanitaire majeur, comme le démontrent de nombreuses études épidémiologiques (1) qui mettent en évidence les conséquences sanitaires avérées d’une exposition prolongée aux polluants atmosphériques (transport, industrie, chauffage…).

 

Contexte et enjeux

La Région Provence-Alpes-Côte d’Azur a adopté un Plan climat, qui s’inscrit dans le mouvement planétaire autour du développement durable. Des indicateurs ont été définis internationalement par les Nations Unies et régionalement, des mesures ont été prises pour agir simultanément sur les problématiques de l’air et du climat.
Le schéma régional d’aménagement, de développement durable et d’égalité des territoires (SRADDET) définit des objectifs et des règles qui vont s’imposer aux collectivités territoriales et aux établissements publics de la région, mais aussi à l’ensemble des acteurs mobilisés, en faveur d’une réduction des émissions de polluants atmosphériques, des émissions de gaz à effet de serre et du nombre de populations exposées.

 

Les données

Dans le cadre des perspectives 2020 – 2022 du programme régional DataSud, adoptées par l’Assemblée régionale en avril 2020, un des axes de développement de l’infrastructure régionale de données ouvertes, géographiques et intelligentes DataSud, est d’en faire un outil opérationnel au service de l’action publique régionale.

La plateforme DataSud permet à l’ensemble des producteurs publics et privés de données de la région de diffuser gratuitement leurs données.

En matière de qualité de l’air, l’association AtmoSud, agréée par le Ministère en charge de l’Environnement, assure la surveillance de la qualité de l’air en Provence-Alpes-Côte d’Azur. Les nombreuses solutions réutilisatrices des données démontrent l’utilité de l’ouverture des données pour améliorer et approfondir les connaissances sur les problématiques environnementales.

L’ambition est aussi de démontrer aux producteurs de données « A quoi sert l’ouverture et la diffusion des données environnementales », par la démonstration du potentiel des « données ouvertes » et des « Open content » pour la conception et la mise en œuvre de projets apportant des solutions aux problèmes environnementaux.

 

Présentation du projet

La Wild Code School forme aux métiers de « data analyst » et de « Web développeur » sur une période de 5 mois.
L’équipe en charge de la réalisation du cas d’usage opérationnel des données est composée de Data Analysts juniors, disposant de compétences sur la gestion des bases de données, la création de dashboards (datavisualisation), et la conceptualisation des modèles de machine learning.

Pendant 8 semaines une équipe de 5 étudiants s’est lancée dans une démarche pédagogique et expérimentale sur la réalisation d’un prototype de réutilisation de données présentes sur DataSud.   Cette démarche vise à présenter des leviers d’amélioration de la qualité de l’air avec  :

  • Un dashboard sur les données diffusées par Atmosud en matière de qualité de l’air en Provence Alpes Côte d’Azur, entre 2015 et 2020, avec un focus sur la période exceptionnelle de confinement liée au COVID-19 qui permet de montrer son impact positif dans la diminution de certains polluants dans l’air.
  • Un modèle de machine learning (SARIMAX) qui permet d’une part d’identifier les déterminants et le processus temporels sous-tendant l’évolution des polluants et d’autre part,  de faire de la prédiction

L’objectif est de favoriser la transmission des informations et les connaissances du public sur la pollution atmosphérique, et de faciliter leur interprétation grâce à certains outils graphiques qui permettent l’exploration et la navigation dans les données.

La présentation du projet au DemoDay de la Wild Code School est consultable en cliquant sur ce lien

La présentation dynamique du projet est enfin disponible, cliquez sur l’image ci dessous pour accéder aux tableaux dynamiques réalisés à partir des données historique de 2015 à juin 2020, portant sur les différents polluants réglementés (  CO, NO2, NOx, O3, PM10, PM2.5, SO2 et C6H6 ) relevés par les stations d’Atmosud.

 

Méthodologie du projet :

Les prototypes des étudiants sont réalisés en suivant une méthode de gestion de projet agile SCRUM (3) .

Les étudiants sont amenés à collecter des données variées et parfois complexes : données d’expérimentation, données d’exploitation, données administratives. Ces données peuvent être stockées sous forme d’ensemble de fichiers, de bases de données, de flux, …

Entre juin et juillet 2020, ils ont travaillé sur la sélection des indicateurs, le traitement des données, la visualisation et le Machine Learning.

Des temps d’échanges hebdomadaires ont été organisés  avec le chef de projet de la Région en mode agile ( Product Owner ) .

Une réunion a été organisée avec le référent Opendata de l’association Atmosud pour apporter un éclairage sur la nature des polluants atmosphériques et des mesures techniques.

Les livrables des travaux des étudiants (bases de données et codes) sont stockés dans le Github du projet 

 

Pour en savoir plus :

(1)  POLLUTION DE L’AIR ET CHANGEMENT CLIMATIQUE EN PROVENCE-ALPES-CÔTE D’AZUR : Le 13ème numéro de la Focale propose un état des lieux des connaissances disponibles en matière de changement climatique et de pollution de l’air : enjeux, impacts sanitaires et premières solutions. Ces réflexions sont issues de nombreux travaux menés en collaboration avec le Groupe régional d’experts sur le climat en Provence-Alpes-Côte d’Azur (GREC-SUD), l’association agréée de surveillance de la qualité de l’air (AtmoSud), l’Agence régionale de Santé, la direction régionale de l’Insee et la Région Provence-Alpes-Côte d’Azur.

(2) 1600 jeux de données ouverts sur DataSud dans des domaines très divers ; des webservices (API, widgets …).

(3) La méthode de gestion de projet SCRUM s’appuie sur le découpage d’un projet en boîtes de temps, nommées « sprints ». Les sprints peuvent durer entre quelques heures et un mois (avec une préférence pour deux semaines). Chaque sprint commence par une estimation suivie d’une planification opérationnelle. Le sprint se termine par une démonstration de ce qui a été achevé. Avant de démarrer un nouveau sprint, l’équipe réalise une rétrospective.

Confinement et évolution de la qualité de l’air en Provence Alpes Côte d’Azur; Qualité de l’air, pollutions et nuisances