Expérience et compétences
Scientifique des données – Data Scientist indépendant

Machine learning

Le « machine learning », ou apprentissage automatique en français, est la discipline qui est à la base du domaine de l’intelligence artificielle. Ce sont donc des modèles de machine learning qui permettent d’obtenir des algorithmes prédictifs capables de se nourrir d’un historique de données pour comprendre et modéliser un système, qu’il soit physique, biologique, sociologique.

Analyse de données

L’intelligence artificielle offre un important éventail d’algorithmes pour mener à bien nombre d’analyses de données, mais d’autres outils d’analyse existent également. Les méthodes statistiques, associées à des modes de visualisations pertinents, apportent ainsi une information précieuse et exploitable.

Algorithmes prédictifs

Les algorithmes prédictifs construits à l’aide du « machine learning » se nourrissent d’un historique de données, à partir duquel ils sont capables d’apprendre des corrélations et relations mathématiques complexes. Cela leur permet d’associer un contexte à l’évolution d’un système, leur conférant par là même leur caractéristique prédictive.

Vincent Berionni

Docteur de l’Ecole Polytechnique dans le domaine de la modélisation en Sciences Physiques, j’exerce le métier de data scientist depuis 8 ans. J’ai décidé de mettre mes compétences au service de la protection de la nature et de l’humain avec Akwari.

Maîtrise des outils techniques du data scientist

  • Python, Pandas, Numpy
  • SciKit Learn
  • Keras, Tensorflow
  • Visualisation : Matplotlib, Bokeh

Les types de modèles et d’analyses prédictives

  • Séries temporelles, détection d’anomalies
  • Scraping, analyse du langage
  • Maintenance prédictive
  • Algorithmes de type capteurs virtuels

Data scientist – Groupe Saur, 2018-2022

Développement de modèles de machine learning, appliqués en particulier aux cas d’usages suivants [Python]

– Prévision de fuites et gestion d’un réseau d’eau potable par intelligence artificielle  – Point 6 de cette référence Pollutec
– Modélisation des consommations d’eau potable en fonction de variables climatiques et sociaux-économiques – Page officielle du projet
– Modélisation prédictive par machine learning du niveau des nappes à partir du contexte climatique, pour anticiper les sécheresses – Télécharger la communication au congrès de l’UNESCO
– Algorithme d’échantillonnage statistique [cas d’usage confidentiel]
– Modèle de machine learning de type capteur virtuel pour la prédiction de la concentration en métabolites (pesticides) dans les cours d’eau – Lien vers le brevet.
– Modèle IA de suivi de dérives et de détection d’anomalies [cas d’usage confidentiel]

Challenge Data ENS et Veolia, décembre 2017

Vainqueur (1er/100) du concours de Data Science / Machine Learning de l’Ecole Normale Supérieure – challengedata.ens.fr – sur le sujet proposé par Veolia concernant la prévision de fuites et casses sur des canalisations d’eau potable : « Failure risk prediction on pipeline network« 

Data scientist – Développeur / Data Scientist / SEO, 2015-2017

– développement intégral du crawler, des algorithmes d’indexation, scoring et classement [Php]
– développement d’un algorithme d’analyse et classification de texte [Python]
– développement d’un algorithme d’identification des conditions météos à partir de webcams [Python]
– co-développement et conception d’algorithmes « intelligents » pour mesurer l’impact d’activités sur sa forme physique et psychologique [Android]

Chercheur – Doctorat et Post-Doctorat à l’Ecole Polytechnique Palaiseau, 2010-2014

Travail de recherche fondamentale 1/3 théorique, 2/3 modélisation – En savoir plus sur ces travaux
– Modélisation de l’évolution de la turbulence dans un plasma de Tokamak (fusion magnétique) avec un système simplifié [Matlab, Python, C]
– Optimisation sous contrainte pour la production maximale d’entropie [Matlab]
– Analyse et visualisation de données [Matlab, Python]

Sous une formule de type data scientist freelance, nous pouvons en particulier effectuer des missions et prestations sur les thématiques suivantes pour répondre à vos problématiques :

Maintenance préventive

La maintenance prédictive permet d’anticiper les pannes ou défaillances sur vos équipements, et donne les clefs pour mieux les gérer et prolonger leur durée de vie.

En savoir plus sur nos services de maintenance préventive

 

Séries temporelles [time series]

Les modèles d’intelligence artificielle pour les séries temporelles permettent d’anticiper et de s’adapter à de nombreuses problématiques : pollutions, évolutions de production etc.

En savoir plus sur nos services de séries temporelles

 

Jumeaux numériques [digital twins]

Un modèle IA de type « digital twins » vous fournit le moyen de calquer vos process de production en numérique et d’obtenir une simulation permettant d’optimiser ce process.