Prévision de la pollution de l’air à Paris (12ème arrondissement) par modèle de machine learning

Influence des phénomènes météorologiques et de la saisonnalité sur les concentrations de particules fines

Ces graphiques présentent l’impact des variables météorologiques et de la saisonnalité sur la valeur de concentration de polluants prévue. Les abscisses représentent le surcroît ou la diminution de concentration en particules fines par rapport à une valeur moyenne.

Ces représentations sont générées à partir des outils de la librairie python Shapash développée par La Maif. Celle-ci a pour objectif de fournir des outils qui permettent de rendre plus compréhensibles et explicables les modèles d’intelligence artificielle et de machine learning.

Données d’entrées

Les concentrations en particules fines sont extraites des mesures d’Airparif, et en particulier de son portail d’open data.

Les prévisions météorologiques sont fournies par Infoclimat via l’api mise à disposition.

Les historiques des données d’observation météorologiques [pluviométrie, vitesse et direction du vent, nébulosité, humidité] proviennent des données Synop de Météo-France.

 

Automatisation sur twitter

Pour rendre cet outil plus dynamique et acessible au plus grand nombre, un « robot posteur » a été implémenté à partir l’API Twitter.
Voir le compte twitter des prévisisions de pollutions aux particules fines à Paris.

 

Méthode

Le modèle de prévision de pollution de l’air (concentration en particules fines inférieures à 2.5 micromètres), est construit avec les technnologies du machine learning (intelligence artificielle). L’historique des données météorologiques et de pollution permet au modèle de se calibrer et « d’apprendre » : c’est ce qu’on appelle la phase d’entrainement. A l’issue de cet entrainement, un autre segment de ces données historiques permet de vérifier la pertinence et la performance du modèle ainsi obtenu, avant sa mise en production effective.