Optimisation des jeux de données de test pour un système d’information hétérogène

Retour d'expérience de projets chez nos clients

.

1.  Contexte

Notre client, un acteur majeur de l'assurance appartenant au CAC 40 et basé en France, fait face à une gestion des jeux de données de plus en plus complexe dans ses environnements de test.

La multiplicité des applications, allant du front office au back office, et l'hétérogénéité des systèmes technologiques en place engendrent des difficultés majeures pour assurer des tests de bout en bout à la fois cohérents et efficaces. Ces défis s'étendent aux applications de gestion de données, aux processus, aux produits d'assurance, de retraite et d'épargne, ainsi qu'aux systèmes interconnectés.

2. Contraintes et défis

Les équipes, organisées en tribus selon la méthodologie SAFe, se chargent de la gestion de pools d'applications. Cependant, elles rencontrent des difficultés à établir une vision homogène de la gestion des données dans les environnements de test. Pourtant, elles peinent à adopter une vision unifiée de la gestion des données dans les environnements de test. Les défis sont nombreux et typiques de ce genre de contexte. Par exemple, l'absence de jeux de données appropriés au moment opportun, comme un cas de test impliquant un client avec trois enfants et un produit d'assurance spécifique, entraîne des retards. De plus, certaines données, une fois utilisées, ne sont pas réutilisables, notamment dans des situations comme un acte de gestion lié à un décès.

Les données doivent souvent transiter par plusieurs systèmes d'information, mais cette intégration est entravée par des applications mal interconnectées ou des correspondances de données incorrectes, rendant impossible le traitement complet des chaînes front-to-back. Cette situation aboutit fréquemment à l'annulation ou au report de nombreux tests, ce qui engendre une frustration généralisée et impacte négativement la qualité en production.

3. Objectifs de la mission

  • Concevoir et proposer à la Direction informatique une approche cohérente et globale de gestion des jeux de données, adaptée aux différentes phases de tests et typologies technologiques, que ce soit pour des applications batch, data hub, web services ou interfaces utilisateur.
  • L'approche visait à garantir la validation des fonctionnalités de chaque application de manière intrinsèque, tout en s'inscrivant dans un processus métier global.

4. Approche Méthodologique

La mission a débuté par l'analyse d'un pool d'applications dans une chaîne de traitement spécifique, permettant de prendre ce système comme référence. Il s’agissait d’une application front-to-back qui correspondant à la « Souscription d’un contrat d’assurance ». Chaque application a été étudiée individuellement pour déterminer les types de traitements et de données nécessaires.

L'analyse a révélé une méconnaissance générale des flux de données inter-applicatifs (avec une vision incohérente des jeux de données des systèmes entrants pour son application ou sortant vers l’application suivante), ainsi qu'une absence de cartographie de ces flux et des processus associés.

La mission a également permis d'identifier les détenteurs de la connaissance métier, fonctionnelle et technique des données : Des ressources dites « rares » possédant des compétences avancées qui créaient leurs propres jeux de données et choisissaient de ne pas partager pleinement leurs connaissances avec le reste de l'équipe. Il a fallu interroger tous les types de gestionnaires de données en production et analyser leur Data Lake pour identifier ces « détenteurs de ces connaissances ». Nous avons ainsi déterminé les méthodes et outils de sélection de données dans les environnements appropriés pour les mettre à disposition, dans les cas d’une recette fonctionnelle ou des recettes de bout-en-bout. Ensuite il a fallu imaginer des solutions de génération de jeux de données pour générer des données utilisables par l’ensemble des acteurs de la chaîne métier.

Au bout de 6 mois de mission notre client a reçu au travers d’une chaîne d’application, une proposition d’usage de l’ensemble des typologies de jeux de données, avec un ensemble de maîtrise fonctionnelle, maîtrise technique, voire anonymisation, pour supporter les processus de bout-en-bout.

Ce document contient un descriptif de l’ensemble des systèmes informatiques de son système d'information, qui permet de générer ou d'acquérir des données pour le compte du test. Que ce soit en provenance de la production, d'un environnement spécifique, par génération, duplication, copie ou mise à jour. Il aborde aussi la gestion des défis liés à l'anonymisation des données, en tenant compte des objectifs de l'entreprise.

De même, la mission a supporté une phase d'acculturation de la communauté de tests, dans toutes les squads, pour expliquer et proposer un panel de solutions dédiées, pour l’utilisation des jeux de données. Un annuaire centralisé des gestionnaires d'outils administrateurs a également été partagé pour faciliter cette mise en œuvre.

5. Les bénéfices de notre solution

Notre solution a permis de mettre en place des méthodes et des outils de sélection de données dans les environnements appropriés, facilitant ainsi les tests fonctionnels et les tests de bout en bout. De plus, des solutions de génération de jeux de données, que ce soit par recopie de production, industrialisation ou automatisation, ont été imaginées pour créer un flux continu de jeux de données prêts à l’emploi par l'ensemble des acteurs de la chaîne métier.

6. Valeur ajoutée de notre intervention

  • En l’espace de six mois, la mission a permis de :
    • Fournir une proposition complète pour l'utilisation des jeux de données dans une chaîne d'application, incluant une maîtrise fonctionnelle, technique, et des mesures d'anonymisation.
    • Centraliser la documentation des systèmes informatiques et des processus de génération ou d'acquisition de données.
    • Mener une phase d'acculturation des équipes de test pour leur offrir des solutions dédiées, assurant ainsi une meilleure gestion des jeux de données de test.

7. Conclusion

Cette mission a démontré que les défis complexes liés à la gestion des jeux de données dans un système d'information hétérogène peuvent être relevés grâce à une approche méthodique et collaborative. En six mois, nous avons non seulement proposé une solution complète intégrant la maîtrise fonctionnelle, technique, et l'anonymisation des données, mais aussi centralisé des processus et formé les équipes pour garantir une gestion optimisée des jeux de données de test.

Les bénéfices se traduisent par une amélioration significative de la qualité des tests, une meilleure intégration des systèmes, et une préparation accrue des équipes face aux exigences des environnements de production.

Mots clé

Jeux de données - Système d'information hétérogène - Gestion des données - Environnements de test - Multiplicité des applications - Tests de bout en bout - Applications front-to-bac - Anonymisation des données - SAFe - Gestionnaires de données - Data Lake - Recopie de production - Industrialisation - Automatisation - Documentation centralisée - Acculturation des équipes - Maîtrise fonctionnelle - Maîtrise technique - Chaîne métier