Expérience et compétences
Scientifique des données – Data Scientist indépendant
Machine learning
Le « machine learning », ou apprentissage automatique en français, est la discipline qui est à la base du domaine de l’intelligence artificielle. Ce sont donc des modèles de machine learning qui permettent d’obtenir des algorithmes prédictifs capables de se nourrir d’un historique de données pour comprendre et modéliser un système, qu’il soit physique, biologique, sociologique.
Analyse de données
L’intelligence artificielle offre un important éventail d’algorithmes pour mener à bien nombre d’analyses de données, mais d’autres outils d’analyse existent également. Les méthodes statistiques, associées à des modes de visualisations pertinents, apportent ainsi une information précieuse et exploitable.
Algorithmes prédictifs
Les algorithmes prédictifs construits à l’aide du « machine learning » se nourrissent d’un historique de données, à partir duquel ils sont capables d’apprendre des corrélations et relations mathématiques complexes. Cela leur permet d’associer un contexte à l’évolution d’un système, leur conférant par là même leur caractéristique prédictive.
Vincent Berionni
Docteur de l’Ecole Polytechnique dans le domaine de la modélisation en Sciences Physiques, j’exerce le métier de data scientist depuis 8 ans. J’ai décidé de mettre mes compétences au service de la protection de la nature et de l’humain avec Akwari.
Maîtrise des outils techniques du data scientist
- Python, Pandas, Numpy
- SciKit Learn
- Keras, Tensorflow
- Visualisation : Matplotlib, Bokeh
Les types de modèles et d’analyses prédictives
- Séries temporelles, détection d’anomalies
- Scraping, analyse du langage
- Maintenance prédictive
- Algorithmes de type capteurs virtuels
Data scientist – Groupe Saur, 2018-2022
Développement de modèles de machine learning, appliqués en particulier aux cas d’usages suivants [Python]
– Prévision de fuites et gestion d’un réseau d’eau potable par intelligence artificielle – Point 6 de cette référence Pollutec
– Modélisation des consommations d’eau potable en fonction de variables climatiques et sociaux-économiques – Page officielle du projet
– Modélisation prédictive par machine learning du niveau des nappes à partir du contexte climatique, pour anticiper les sécheresses – Télécharger la communication au congrès de l’UNESCO
– Algorithme d’échantillonnage statistique [cas d’usage confidentiel]
– Modèle de machine learning de type capteur virtuel pour la prédiction de la concentration en métabolites (pesticides) dans les cours d’eau – Lien vers le brevet.
– Modèle IA de suivi de dérives et de détection d’anomalies [cas d’usage confidentiel]
Challenge Data ENS et Veolia, décembre 2017
Vainqueur (1er/100) du concours de Data Science / Machine Learning de l’Ecole Normale Supérieure – challengedata.ens.fr – sur le sujet proposé par Veolia concernant la prévision de fuites et casses sur des canalisations d’eau potable : « Failure risk prediction on pipeline network«
Data scientist – Développeur / Data Scientist / SEO, 2015-2017
– développement intégral du crawler, des algorithmes d’indexation, scoring et classement [Php]
– développement d’un algorithme d’analyse et classification de texte [Python]
– développement d’un algorithme d’identification des conditions météos à partir de webcams [Python]
– co-développement et conception d’algorithmes « intelligents » pour mesurer l’impact d’activités sur sa forme physique et psychologique [Android]
Chercheur – Doctorat et Post-Doctorat à l’Ecole Polytechnique Palaiseau, 2010-2014
Travail de recherche fondamentale 1/3 théorique, 2/3 modélisation – En savoir plus sur ces travaux
– Modélisation de l’évolution de la turbulence dans un plasma de Tokamak (fusion magnétique) avec un système simplifié [Matlab, Python, C]
– Optimisation sous contrainte pour la production maximale d’entropie [Matlab]
– Analyse et visualisation de données [Matlab, Python]
Missions longues
- Pour des missions de longue durée et/ou qui reposent sur des technologies, des méthodologies déjà développées et expérimentées sur d’autres cas d’usages, ne demandant pas d’exploration supplémentaire importante.
Missions courtes
- Pour des missions plus courtes et/ou qui nécessitent un approfondissement particulier en dehors du nombre de jours consacrés à la mission, le développement de modèles spécifiques hors des standards communément rencontrés.
Sous une formule de type data scientist freelance, nous pouvons en particulier effectuer des missions et prestations sur les thématiques suivantes pour répondre à vos problématiques :
Maintenance préventive
La maintenance prédictive permet d’anticiper les pannes ou défaillances sur vos équipements, et donne les clefs pour mieux les gérer et prolonger leur durée de vie.
En savoir plus sur nos services de maintenance préventive
Séries temporelles [time series]
Les modèles d’intelligence artificielle pour les séries temporelles permettent d’anticiper et de s’adapter à de nombreuses problématiques : pollutions, évolutions de production etc.
En savoir plus sur nos services de séries temporelles
Jumeaux numériques [digital twins]
Un modèle IA de type « digital twins » vous fournit le moyen de calquer vos process de production en numérique et d’obtenir une simulation permettant d’optimiser ce process.