Des modèles de séries temporelles pour optimiser vos procédés et réduire les risques
Le terme de séries temporelles, time series en anglais, recouvre une grande variété de phénomènes. Elles sont définies de la manière la plus générale comme une suite de valeurs numériques dans l’ordre chronologique. Elles sont plus spécifiquement remarquables lorsqu’elles sont composées d’une saisonnalité récurrente et de tendances clairement identifiables.
La saisonnalité peut être liée une échelle temporelle diverse selon le phénomène scruté : horaire, journalière, hebdomadaire, mensuelle ou annuelle la plupart du temps. Le plus souvent, c’est une composition de ces différentes périodes de retour qui décrire au mieux l’évolution de la quantité suivie au cours du temps. Celles constituent ainsi un cycle, un schéma temporel plus ou moins complexe.
Les tendances peuvent survenir à des échelles de temps supérieures ou inférieures à celle la saisonnalité dominante. Par exemple une nappe phréatique pourra avoir son niveau baisser sur une tendance pluriannuelle, tandis que sa saisonnalité typique est principalement annuelle.
L’évolution globale de la grandeur suivie sera donc résultante de la composition de la saisonnalité et des tendances. Auxquelles s’ajouteront d’autres variations non récurrentes ni persistantes, provoquées par des facteurs ne relevant ni de l’une ni de l’autre.
Faut-il nécessairement faire appel aux algorithmes de l’intelligence artificielle pour prévoir des séries temporelles ?
La réponse est non ! L’analyse des séries temporelles remonte d’ailleurs à bien avant l’arrivée des outils numériques, et ces derniers proposent d’autres modèles sans IA, encore largement utilisés actuellement. Néanmoins, l’IA et l’apprentissage automatique (machine learning) fournissent des solutions très pratiques et très efficaces, souvent plus performantes que les modèles numériques traditionnellement employés pour les séries temporelles.
A quelles problématiques répondre avec des modèles de « time series » basés sur l’intelligence artificielle ?
L’usage des modèles de types séries temporelles est vaste, et recoupe plusieurs autres thématiques de l’intelligence artificielle. Nous vous proposons une liste non exhaustive d’utilisations possibles et concrètes :
Maintenance prédictive : une partie des algorithmes qui découlent de la maintenance prévisionnelle fait appel aux fondements des séries temporelles. Il s’agit notamment de la capacité à prédire les pannes de machines ou process, en fonction de l’évolution temporelle des conditions de fonctionnement. Lire notre page dédiée aux modèles de maintenance préventive.
L’anticipation de phénomènes naturels ou d’origine humaine est également couvert par les technologies des séries temporelles. Cela peut être le cas de la prédiction de pollutions (eau, air, sol), à l’image de la prévision en temps réel de pollution de l’air aux particules fines développée par Akwari. La prévision des sécheresses ou des inondations est un autre cas d’usage dont le besoin croîtra avec l’amplification du changement climatique : vous pourrez en apprendre plus en lisant cet article.
Jumeaux numériques : prévoir une valeur idéale de réglages dans un process de fabrication ou de traitement. Un algorithme prédictif pourra extrapoler et simuler l’impact futur de différentes configurations, et ainsi suggérer celle qui est optimale pour l’objectif souhaité. Ce dernier peut être la réduction de la consommation d’énergie, d’un risque sanitaire ou sécuritaire, ou encore l’optimisation de l’usage d’une quantité de matière première. Dans ce cadre, on parle souvent de jumeaux numériques (ou « digital twin » en anglais), avec l’idée d’avoir une simulation numérique en temps réel à l’image du process concerné.
Connaître à l’avance une demande, un besoin, par exemple une consommation d’eau ou d’énergie sur un périmètre géographique donné. Ce type de modèle peu fonctionner en binôme avec un autre : un algorithme prédisant la consommation d’électricité sera avantageusement complété par un modèle prédictif de la production électrique (en lien avec l’ensoleillement par exemple), indiquant ainsi quels moyens de production supplémentaires mettre en oeuvre.
Ce dont nous avons nous besoin pour construire un modèle et faire des analyses : données et historiques
Historique nécessaire
A l’image de la plupart des algorithmes prédictifs de type « machine learning », les modèles de type séries temporelles ne peuvent être construits (« entraînés », dans le vocabulaire de la discipline) qu’en présence d’un historique de données suffisant, décrivant au mieux les équipements concernés et leur contexte d’utilisation et de fonctionnement
En général, la durée de l’historique de données nécessaire à un bon apprentissage est de l’ordre de quelques mois, pour de évènements fréquents et récurrents, à quelques années, pour des évènements plus rares.
Type de données exploitables
Les données que vous pouvez nous fournir pour construire un modèle sont de diverses natures. En dehors de l’historique de la grandeur dont on souhaite estimer l’évolution, aucune n’est indispensable, mais elles sont autant d’éléments améliorant la performance du modèle de maintenance préventive. Selon le cas d’usage, on retrouvera par exemple :
– historiques de la grandeur à prédire
– saisonnalité [intégrée par nos soins]
– données météorologiques (pluviométrie, vent, température, humidité…)
– conditions de fonctionnement (dans le cas d’un équipement, d’une machine) : vibrations, acoustique, fréquence, durée d’utilisation…
– consommations : d’énergie, de combustible, de réactif…
A partir de ces mesures de base, ou d’une partie d’entre elles, un grand nombre de variables secondaires sont calculées et intégrées dans la construction du modèle. L’historique fourni permettra également d’évaluer la pertinence de l’algorithme construit.
Pour aller plus loin et confronter votre cas d’usage à la faisabilité du développement d’un algorithme prédictif de type séries temporelles :
Comment mettre en place votre modèle de séries temporelles ?
Nous vous proposons des services de deux natures différentes :
– un développement selon une formule de type « data scientist freelance » pour votre modèle de séries temporelles, personnalisé selon vos besoins, avec une phase d’étude et une phase de mise en production dans le système informatique de votre choix, facturé en fonction du nombre de jours de travail nécessaire au projet.
– un service de type abonnement récurrent, dont le coût est calculé à partir du nombre d’équipements ou d’unités concernés, des fonctionnalités souhaitées et de la complexité/durée nécessaire à construire le modèle.
Pour aller plus loin : services et autres ressources
– Découvrez les autres solutions de data science et d’analyses de données sur mesure élaborées par Akwari
– Cours sur les séries temporelles (Université de Lyon)
– L’excellente série d’articles de Statoscop sur l’analyse des séries temporelles avec Python :
Séries temporelles Partie 1 – Partie 2 – Partie 3 – Partie 4
– Présentation des séries temporelles sur Data Science Test