open_resource : idées, points de vue
et solutions des acteurs de la révolution de la ressource



← Retour Focus révolution numérique  

data scientist : un nouveau profil d’expert dans la révolution de la ressource

09.07.2018

C’est un fait qui n’est plus à démontrer : nous n’avons jamais eu accès à autant de données en même temps. Depuis quelques années, une nouvelle génération d’algorithmes est capable de gérer cet « or noir du XXIe siècle » toujours plus rapidement, rendant opérant le fameux big data. Encore à ses débuts, la discipline qui consiste à tirer profit de cette immense masse de données, appelée la science des données (ou « data science »), est perçue comme l’un des piliers de la convergence de la transition écologique et numérique.

LDE IDF Nord et Ouest - usine de production d'eau potable de Louveciennes, dispatching - Crédits : SUEZ / William Daniels

Usine de production d’eau potable de Louveciennes – Crédits : SUEZ / William Daniels


Assis face à ses grands écrans d’ordinateur, Gilles Faÿ a les yeux rivés sur des tableaux de données et des lignes de codes. Avec lui, trois autres personnes composent l’équipe de data scientists du Centre international de recherche sur l’eau et l’environnement (CIRSEE), l’un des centres de compétences du groupe SUEZ mobilisés pour une gestion innovante des ressources. « J’y travaillais depuis deux ans, lorsque le poste a été créé, dit l’expert. Avant, j’étais professeur des universités en mathématiques appliquées. » Preuve de l’intérêt pour les sciences des données, l’effectif de l’équipe pourrait doubler d’ici fin 2018.

En dix ans, la discipline a en effet pris une part de plus en plus importante dans les stratégies de gestion des ressources : scénarios prédictifs, identification des failles pour optimiser les rendements, amélioration des profils clients… Le data scientist se situe au coeur de ces questionnements, tirant profit des masses immenses d’informations disponibles provenant de toutes sortes de sources : opérationnelles, météorologiques, bases clientèles (industriels et particuliers), images satellitaires, vidéos de surveillance, etc. SUEZ compte ainsi près de trois millions de compteurs d’eau communicants déployés dans le monde, collectant plusieurs fois par jours des index de consommation d’eau par le biais d’un émetteur radio.

Réunissant des compétences aussi variées que les mathématiques, la statistique, la programmation ou encore l’ingénierie informatique, le data scientist fait partie des perles rares pour les recruteurs.


Faire parler la data

Gilles Faÿ ne passe pas toutes ses journées à manier les langages open source du machine learning (apprentissage statistique), comme Python ou R. Il se déplace régulièrement sur le terrain à la rencontre des « opérationnels » pour comprendre leurs attentes et leurs besoins. « La moitié du chemin est faite quand la bonne question est formulée », dit-il.

Son travail sera ensuite d’essayer d’y répondre et de se demander s’il est possible d’y arriver avec les données. « Mais avoir des données ne suffit pas, ajoute Gilles Faÿ. Celles-ci peuvent n’être que du bruit, des données sales ou partielles. » C’est là que le data scientist entre en
jeu : « Notre but est de faire parler les données, et on commence par les nettoyer, les réorganiser, les filtrer. »

L’équipe du CIRSEE n’a pas pour mission de réinventer le machine learning, mais utilise les algorithmes disponibles pour « mettre le tout en musique ». Même si la volonté est de former au maximum les métiers de SUEZ pour les rendre plus indépendants dans l’interprétation des résultats, cette étape requiert encore des professionnels de la statistique. « Sinon il est très facile de faire dire n’importe quoi aux données. »


Transformer la data au service de la ressource

« Le défi de SUEZ est d’avoir une gestion agile des données pour qu’elles soient activables ensemble afin de faire ressortir les informations importantes », rappelle l’expert.

Après avoir répondu à la question posée par le métier, la prochaine étape est le développement d’applications à partir d’outils de visualisation. Il s’agira par exemple de créer un module algorithmique qui détecte en temps réel les anomalies sur la qualité de l’eau distribué dans le réseau (via AQUADVANCED®) ou bien d’optimiser les trajets et les calendriers de collecte des déchets à partir de capteurs disposés sur les bennes ou d’informations de pesées. Le calendrier classiquement hebdomadaire peut alors être modifié en fonction du remplissage.

Plusieurs techniques sont utilisées : le clustering (pour créer des archétypes de comportements par exemple), la régression (pour la maintenance prédictive ou réduire les coûts d’inspection), la classification (pour identifier des fuites à partir d’une classe de signatures hydrauliques), etc.


La data au service du client

Les avantages se situent aussi bien au niveau de la relation client pour lui proposer un meilleur prix ou pour l’aider à maîtriser sa consommation de ressources, que dans la prospection de nouveaux contrats. Teddo Van Mierle peut en témoigner. Data scientist pour SUEZ aux Pays-Bas, il travaille depuis neuf ans dans l’intelligence marketing en intégrant la science des données. « Aujourd’hui, la capacité de stockage a augmenté et les données disponibles se comptent en millions. Nous avons donc développé de nouvelles plateformes automatisées pour les traiter en quelques secondes. » En effet, les données externes (temps et prévisions météorologiques, tendances économiques, informations sur le développement, etc.) sont utilisées pour enrichir les données internes de SUEZ, permettant de mieux appréhender ce qui se passe et, plus important encore, de déterminer quelles sont les influences externes et internes sur le comportement des clients.

C’est ainsi que l’application Sales Excellence, développée par les équipes de SUEZ, fédère l’ensemble de ces données collectées et fusionnées, avec des analyses hautes performances effectuées quasiment en temps réel. Ce système permet ainsi aux équipes commerciales de savoir au quotidien quels sont les clients/prospects les plus susceptibles de signer un contrat, de démissionner et quels services sont les plus susceptibles d’être demandés.

Un autre exemple est le datalake pour SUEZ Trading. Les données de neuf pays européens sont collectées et uniformisées automatiquement. Ensuite, l’analyse (prédictive) permet d’avoir une vue d’ensemble complète des tendances et du développement des réseaux de dispositifs de SUEZ Trading. Grâce à l’énorme quantité de données comportementales fournies par les clients, SUEZ dispose, en fin de compte, d’informations fiables sur les processus clients (relatives aux déchets) pour toutes les catégories de clients. « De cette façon, nous pouvons proposer une optimisation du service tout en augmentant notre marge. C’est là que l’ordinateur prend en charge le travail, prenant des décisions en temps réel fondées sur les règles de gestion et de la logique décisionnelle. »

Teddo Van Mierle collabore avec deux autres personnes à la collecte des données, leur préparation, uniformisation, ajustements, analyse et visualisation. Le plus important est l’automatisation (intelligence artificielle) de ces processus. « Les ordinateurs s’occupent du reste. Mais on vérifie si les modèles de prédiction sont toujours valides ou s’il faut ajuster l’algorithme. »

De l’opérationnel au client

Sophie, c’est le nom donné à l’intelligence artificielle de l’application Sales Excellence qui travaille 24h/24, 7j/7, remplaçant des tâches effectuées par des personnes qui remplissaient des tableaux à coups de clics et de copier-coller. « La révolution digitale a vraiment changé le monde du travail, se réjouit Teddo Van Mierle. L’opérationnel, qui est plus le sujet de Gilles Faÿ, et les perspectives marketing et commerciales, qui sont de mon domaine, se rejoignent dans la science des données. »

Avec une dizaine de projets par an menés au sein du CIRSEE, la science des données tient de belles promesses pour le groupe. « Mais nous sommes encore modestes concernant le big data, confie Gilles Faÿ, il reste encore beaucoup à faire avec des jeux de données inexploités. » D’autant que le développement du machine learning est loin d’avoir atteint ses limites. Dans son ouvrage Big Data, penser l’homme et le monde autrement, Gilles Babinet prédit ainsi que « si la puissance des ordinateurs devait continuer à croître à cette vitesse durant quelques dizaines d’années, la capacité de projection issue de ces calculs se situerait tout simplement au-delà de nos capacités d’imagination ».

SUEZ a par ailleurs passé un nouveau cap dans sa transformation digitale avec le recrutement de Meriem Riadi à la mi-septembre 2017 au poste de « Chief Digital Officer » (traduit par directrice de la transformation digitale).

« Ma mission s’organise autour de trois dimensions :

– définir la roadmap digitale du groupe, qui s’organise autour de quatre axes : la digitalisation de la relation client, la performance des actifs et des opérations, la performance individuelle et collective et enfin l’établissement de nouveaux business models (market place dans le déchet, smart city) ;

– accélérer au niveau du groupe les sujets opérationnels à impact : le focus en 2018 serait fait sur les applications opérationnelles de la data et de l’intelligence artificielle ;

– développer l’open innovation : partenariats avec les start-up techs, les incubateurs/accélérateurs, les partenariats avec les universités et les initiatives d’intrapreneuriat. »

Ces nouveaux objectifs s’appuieront en grande partie sur la récolte et le traitement des données qui permettront de fournir aux clients de nouveaux services à valeur ajoutée mais également d’optimiser nos opérations. L’enjeu pour SUEZ : devenir une entreprise « data driven » pour accroître sa compétitivité et accélérer la révolution de la ressource.






Cet article a été publié dans le cinquième numéro d’open_resource magazine : « La gestion des ressources à l’ère du digital »





Vous aimerez aussi